공부 72

실전 머신러닝 1장 데이터셋 분할/데이터 전처리

학습 데이터(Train set) 전체의 80%비율로 학습 기계에게 인풋을 넣고 어떤 값이 나오는지 알려주는 데이터(교과서) 검증 데이터(Validation set) 학습 중인 모델 평가, 하이퍼파라미터를 조정하는데 사용되는 데이터셋 과적합을 감지함(모의고사) 테스트 데이터(Test set) 모델이 잘 학습되었는지 확인하기 위한 데이터(수능) 데이터 전처리 표준 스케일링: 피처별로 평균과 분산이 0과 1이 되도록 선형 변환하는 데이터 표준화 과정 기존 데이터가 정규분포를 따르는 경우 적합 최소-최대 스케일링: 피처별로 최솟값과 최댓값이 각각 0과 1이 되도록 선형 변환하는 데이터 표준화 과정 데이터의 최솟값과 최댓값이 명확하고 이상치가 없는 경우 적합 모델 선택 모수적 모델: 데이터가 특정 확률 분포를 따..

공부 2023.12.07

실전 머신러닝 1장 머신러닝 개념/모델/시간&공간복잡도

머신러닝 -목적에 따라 지도학습: 입력 피처와 입력 피처에 해당하는 목표 변수의 쌍이 주어졌을 때 이 관계를 모델링하여 입력으로 들어온 새로운 피처로 목표 변수 예측 (분류,회귀 문제) 비지도학습: 피처 공간만 주어진 상태에서 학습하여 피처 공간의 분포를 모델링하고 인사이트 도출 (군집화, 이상값 탐지) 강화학습: 행동의 좋고 나쁜 정도를 학습 알고리즘에게 알려 주는 것 강화형 기계 학습의 대상이 되는 컴퓨터 프로그램을 에이전트(agent)라고도 한다. 에이전트는 주어진 상태에서 자신이 취할 행동을 표현하는 정책(policy)을 수립한다. 에이전트가 최대의 보상을 받을 수 있는 정책을 수립하도록 학습시키는 것이 강화형 기계 학습의 목표이다.[네이버 지식백과] 머신러닝 모델 지도학습 모델-선형 모델: 최소..

공부 2023.12.07

알고리즘 BFS(너비우선탐색)

# BFS - 너비 우선 탐색(Breadth-First Search, BFS)은 그래프를 탐색하기 위한 대표적인 알고리즘 중 하나로, 시작 노드로부터 가까운 노드부터 차례대로 탐색하는 방식(자기 자식을 우선 탐색) - Graph:Vertex(어떤것)+Edge(이어지는것) - 해당 알고리즘은 그래프 탐색, 최단 경로 찾기, 네트워크 트래픽 경로 계산 등에 활용 - 주로 Queue 자료구조를 활용하여 구현 - Queue는 리스트의 한쪽 끝에는 삽입 작업이 이루어지고 한쪽 끝에는 삭제 작업이 이루어지는 선입선출FIFO 구조로 운영되는 유한 순서 리스트 ## 시간복잡도 - BFS: o(v+e) - vertex 계산 + edge 갯수 BFS의 순회경로는 다음과 같다. 1. A를 방문 2. A 인접 정점 B,C 방..

공부/python 2023.11.24

enumerate

enumerate 함수는 순서가 있는(iterable) 자료형(리스트, 튜플, 문자열 등)을 입력으로 받아, 각 원소와 그 인덱스를 포함하는 enumerate 객체를 반환하는 파이썬의 내장 함수 예시 my_list = ['apple', 'banana', 'cherry'] for index, value in enumerate(my_list): print(f"Index: {index}, Value: {value}") 리스트 생성 후 apple,banna,cherry 입력 enumerate는 주로 for문과 같이 사용된다. format함수를 사용하여 출력해보자 Index: 0, Value: apple Index: 1, Value: banana Index: 2, Value: cherry 위의 for문에서 ind..

공부/python 2023.11.23

백준 11718번 그대로 출력하기

이 문제의 목적은 문자열을 올바르게 입력받고 파일의 끝(EOF)을 올바르게 판단하는 법을 연습하는 것입니다. 총 몇 줄이 주어진다 등의 정보는 절대 입력으로 주지 않습니다. 또한 단순히 키보드로 입력 내용만 적고 프로그램이 종료되지 않은 상태까지만 봐서는 EOF를 제대로 처리했는지 알 수 없습니다. 더 이상 읽을 게 없을 때 프로그램을 종료하는 법을 알아야 합니다. try except 구문 코드를 치다가 궁금해서 정리해보는 try-except와 if-else의 차이!파이썬에서 프로그래밍 하면서 다양한 에러가 발생할 수 있는데 에러가 발생하는 상황에서 이 예외를 처리할 수 있는 구문이 try-exce velog.io

공부/코테 2023.11.23

백준 10950번 A+B - 3

test_count = int(input()) results = [] for _ in range(test_count): test1, test2 = input().split() result = int(test1)+int(test2) results.append(result) for result in results: print(result) test_count -정수형으로 입력받기 results - 빈 리스트 생성 for문 test_count - 테스트 개수만큼 반복 test1,test2 - 입력받고 공백을 기준으로 분리 result - 정수형으로 전환 후 합 구하기 results.append(result)- 빈 리스트에 구한 합들을 넣어주기 for문 - 리스트 내 result(test1+test2) 값들 반..

공부/코테 2023.11.23

IQR 이상치

이상치 탐지를 위한 사분범위(InterQuartile Range, IQR) 작년부터 BLE에서 발생하는 스푸핑 공격 탐지 시스템의 개발을 위해 관련된 논문이나 정보들을 찾아 읽어보기 시작했습니다. 저는 단순히 스푸핑 공격을 감지하는 것이 아닌 사용자와 공격자를 ahang.tistory.com 이상치: 극단적으로 튀는 값 [이상치의 특징] 1. 극단적인 값 2. 예외적인 패턴: 예상되는 데이터에서 벗어나는 패턴을 지님 3. 실수 또는 에러 4. 통계적 이상성 이상치는 데이터 분석에서 고려되어야 하는 이유 중 하나는 이상치가 모델링 결과를 왜곡시키고 잘못된 결론을 도출할 수 있다는 것. 따라서 이상치를 식별하고 처리하는 것은 데이터의 신뢰성을 높이고 정확한 분석 결과를 얻기 위한 중요한 단계. IQR (In..

공부/python 2023.11.04

계속 혼동 된다.. map 함수

map(function,iterable) map() 함수는 파이썬에서 사용되는 내장 함수 중 하나로, 반복 가능한(iterable) 객체(예: 리스트, 튜플)의 각 요소에 대해 특정 함수를 적용하여 새로운 이터러블 객체를 생성하는 데 사용. function: 각 요소에 적용하려는 함수를 지정합니다. 이 함수는 iterable의 각 요소에 적용됩니다. iterable: 함수가 적용될 반복 가능한 객체(예: 리스트, 튜플)를 지정합니다. map() 함수는 요소별로 function을 호출하고, 그 결과를 새로운 이터러블 객체로 반환합니다. 이때, 원본 iterable의 순서는 그대로 유지됩니다. 결과로 반환되는 객체는 map 객체이며, 이 객체를 리스트나 튜플로 변환하거나 반복할 수 있습니다. 파이썬 코딩 도..

공부/python 2023.10.23