1. 회귀 분석(Regression Analysis) 회귀 분석은 두 변수 사이의 연관성을 분석할 때 가장 많이 사용하는 방법이다. 회귀분석은 독립변수와 종속변수의 관계를 함수식으로 설명한다. - 종속변수 : 우리가 알고 싶어하는 결과 값 - 독립변수 : 종속변수에 영향을 주는 값 ex) 학생들의 키를 가지고 몸무게를 예측하고자 한다면, 키 : 독립변수, 몸무게 : 종속변수 2. 선형 회귀란? 선형은 독립변수가 1차항으로 되어있음을 의미한다. 즉, 독립변수에 지수항이 존재한다면, 비선형이 되므로 선형 회귀분석이 불가능하다. 선형 회귀식을 풀기 위해서 가장 많이 사용하는 방식은 '최소제곱법'이다. 3. 회귀 분석 방법 독립변수가 1개인 선형 회귀식은 아래와 같이 나올 것이라고 가정한다. 이 식을 바탕으로 ..
1. 공분산 - 공분산의 정의두 확률변수 의 기대값을 각각 라고 하자. 공분산 는 다음과 같이 정의한다. - 공분산의 의미공분산은 두 개의 확률 변수 간의관계를 보여준다. 확률변수 X가 평균으로부터 큰 값을 가질 때, Y역시 큰 값을 가지는 경향이 생기면 둘 사이의 공분산은 양의 값을 가진다. 반대로, 확률변수 Y가 작은 값을 가지는 경향이 생기면 공분산은 음의 값을 가진다. 공분산의 크기가 0이라면 두 확률변수는 서로 관계가 없음을 의미한다. 이때 두 확률변수가 서로 독립이라고 말한다.단, 공분산은 두 확률 변수 간의 관계를 보여주는 정보로 사용 가능하지만, 절대적인 값으로 활용 하지는 못한다. 확률변수의 측정 단위에 따라 그 값이 크게 달라진다. 두 변수 사이의 관계를 보여주는 절대적인 값으로는 다음..
1. 머신러닝(Machine Learning)의 정의 톰 미첼(카네기멜론 대학교)의 정의"A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E" 만약 컴퓨터 프로그램이 태스크 T를 수행할 때 경험 E로부터 성능 P만큼 개선되었다면 그 컴퓨터 프로그램은 태스크 T와 성능 P에 대해 경험 E에 대한 학습을 했다고 할 수 있다. (필기체를 보고 글자를 인식하는 머신러닝 프로그래밍을 한다고 가정한다면)태스크 T: 필..