몽-구
몽구의 우당탕탕 개발 공부
몽-구
전체 방문자
오늘
어제
  • 분류 전체보기 (106)
    • PS (38)
      • 백준 (24)
      • 프로그래머스 (14)
    • Dev (58)
      • Kotlin (0)
      • Java (4)
      • Spring, SpringBoot (1)
      • C (8)
      • Python (10)
      • Dart (1)
      • 알고리즘 (7)
      • 자료구조 (3)
      • Git (1)
      • Linux (2)
      • VS Code (1)
      • 환경 설정 (8)
      • Conference (1)
      • 42Seoul (3)
      • Node.js (1)
      • ShellScript (1)
      • IntelliJ (0)
      • MacOS (2)
      • 기타 (3)
    • CS (1)
      • 데이터베이스 (1)
    • DS (4)
      • Coursera (4)
    • 리뷰 (1)
      • 제품 리뷰 (1)
    • 일상 (3)
      • 자동화 (1)
      • 목표 및 계획 (2)
      • 회고 (0)
    • 삶에 대한 태도 (1)
      • 유튜브를 보며 (1)

블로그 메뉴

  • GitHub

인기 글

반응형

태그

  • Linux
  • 백준
  • 프로그래머스
  • Algorithm
  • 코딩테스트
  • Python
  • 백준알고리즘
  • 백준온라인저지
  • BOJ
  • 파이썬
  • 리눅스
  • sort
  • 알고리즘
  • 정렬
  • c언어

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
몽-구

몽구의 우당탕탕 개발 공부

머신러닝에 대한 정의 (Maching Learning Definition)
DS/Coursera

머신러닝에 대한 정의 (Maching Learning Definition)

2020. 2. 10. 21:18
반응형

 

Arthur Samuel(1959)

Machine Learning is Field of study that gives computers the ability to learn without being explicitly programmed.

 

Tom Mitchell(1998)

Machine Learning is Well-posed Learning Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.

 

Arthur Samuel의 정의보다는 최근에 나온 Tom Mitchell의 정의를 살펴보자. Tom Mitchell은 머신러닝을 학습 과제(well-posed learning problem) 중심으로 정의하고 있다.

 

Andrew Ng 교수님은 이것을, "프로그램이 일정 수준의 작업 성능(P)을 가지고 작업(T)을 수행한다고 했을 때, 경험(E)이 증가함에 따라 작업(T)를 수행하는 성능(P)이 향상될 수 있으며, 이때 프로그램이 경험(E)으로부터 학습을 했다고 표현한다" 고 풀이했다.

 

만약 나의 이메일 프로그램이 '내가 어떤 이메일을 스팸 메일로 체크하고 어떤 이메일을 스팸으로 체크하지 않는지' 확인하고, 그 사실에 기반하여 더 어떤 것들을 스팸으로 필터링하는 것이 옳은지 학습한다고 가정해보자. 이 경우, 작업 성능(Performance measure)과 작업(Task), 경험(Experience)은 다음과 같다.

 

작업(T) : (프로그램이) 이메일을 스팸/정상 메일로 분류하는 행위 (Classifying emails as spam or not spam)

경험(E) : (프로그램이) 내가 이메일을 스팸/정상 메일로 분류하는 것을 관찰하는 것 (Watching you emails as spam or not spam)

성능(P) : 정확하게 분류된 이메일의 비율 (The number (or fraction) of emails correctly classified as spam/not spam)

 

즉, 프로그램이 분류된 이메일의 비율(P)을 가지고 이메일을 스팸/정상 메일로 분류(T)한다고 가정해보자. 프로그램은 내가 어떤 이메일을 스팸/정상 메일로 분류하는지 관찰(E)을 하면 할수록 프로그램이 메일을 분류하는 정확도(P)가 향상될 수 있으며, 이때 프로그램은 내가 어떤 이메일을 스팸/정상 메일로 분류하는지 관찰(E)하여 학습을 했다고 할 수 있다.

 

source : Andrew Ng <Machine Learning> - Introduction - "what is machine learning", Coursera

 

 

반응형

'DS > Coursera' 카테고리의 다른 글

비용함수(Cost Function) #1  (0) 2020.02.14
비지도학습(Unsupervised Learning)에 대한 이해  (2) 2020.02.13
지도학습(Supervised Learning)에 대한 이해  (0) 2020.02.11
    'DS/Coursera' 카테고리의 다른 글
    • 비용함수(Cost Function) #1
    • 비지도학습(Unsupervised Learning)에 대한 이해
    • 지도학습(Supervised Learning)에 대한 이해
    몽-구
    몽-구
    소망보단 목표를, 생각보단 실천을

    티스토리툴바