-
SK쉴더스 루키즈AI 10, 11일차 - 머신러닝정보 보안 2025. 6. 20. 16:11
머신러닝이란 데이터를 기반으로 컴퓨터가 스스로 학습하여 패턴을 발견하고
이를 이용해 미래의 결과를 예측하거나 의사결정을 내리게 만드는 기술비지도학습 - 데이터는 주고 라벨(정답)은 주어지지 않은 상태에서 학습시킴
데이터의 패턴이나 그룹을 학습
ex) 고객 그룹화 (임의대로)
지도학습 - 데이터에 라벨(정답)이 있음
데이터와 라벨 사이의 관계를 학습
ex) 스팸 메일 분류
데이터에는 2종류가 있는데,
컴퓨터가 학습하는 학습데이터와
잘 학습되는지 확인하는 테스트데이터가 있다.
왜 분리하냐면 공부한 문제(학습데이터)만 계속 풀어보면,
실제로 얼마나 잘하는지 알 수 없으니까
그래서 처음 보는 문제(테스트데이터)로
실력을 확인하려고 따로 분리한다.학습데이터에 과하게 적합해지는 과적합도 해결하기 위해서 분리한다.
선형회귀는
y = mx + b의 직선방정식으로 표현한다.
ex) y-시험점수 x-공부시간 m-공부시간과 시험점수의 비례관계 b-공부시간 0일 때 시험점수
MSE는 오류를 측정하는 함수인데,
MSE가 최소가 되도록 조금씩 m과 b를 수정하는 것이 학습의 과정이다.
MSE말고도 여러가지 평가 지표가 있다.
로지스틱회귀 (선형회귀랑 다름)
분류할 때 사용 (Yes/No, 0/1)
ex) 메일이 스팸인가 아닌가?
S자 곡선 써서 확률 계산
→ 결과: 0이나 1 (또는 확률)'정보 보안' 카테고리의 다른 글
SK쉴더스 루키즈AI 12,13일차 - 딥러닝,colab (0) 2025.06.24 SK쉴더스 루키즈AI 7,8,9일차 - 데이터 전처리, EDA (1) 2025.06.18 게임개발 19일차 (Unity Learn 9일차) (1) 2025.06.15 SK쉴더스 루키즈 6일차 - 파이썬 모듈, numpy (0) 2025.06.13 SK쉴더스 루키즈 5일차 - 파이썬 클래스 (0) 2025.06.12