Post

Chapter 01. 인공지능과 머신러닝, 딥러닝

  • 진도: 55~
  • 이해되지 않는 부분 표시 , 중요한 부분 표시

나의 첫 머신러닝

인공지능과 머신러닝, 딥러닝

  • 인공지능: 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템을 만드는 기술
  • 인공일반지능 혹은 강인공지능: 흔히 영화 속의 인공지능
  • 약인공지능: 현실에서 우리가 마주하고 있는 인공지능으로, 특정 분여에서 사람의 일을 도와주는 보조 역할만 가능하다.

  • 머신러닝: 규칙을 일일히 프로그래밍하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야이다.
  • 통계학에서 유래된 머신러닝 알고리즘이 많으며 통계학과 컴퓨터 과학 분야가 상호 작용하면서 발전하고 있다.
  • 사이킷런: 컴퓨터 과학 분야의 대표적인 머신러닝 라이브러리

  • 딥러닝: 많은 머신러닝 알고리즘 중에 인공 신경망을 기반으로 한 방법들을 통칭하여 부르는 말
  • 딥러닝 라이브러리: 구글의 텐서플로, 페이스북의 파이토치

코랩과 주피터 노트북

  • 셀: 코랩에서 실행할 수 있는 최소 단위
  • 코랩: 구글 계정이 있으면 누구나 사용할 수 있는 웹 브라우저 기반의 파이썬 코드 실행 환경
  • 노트북: 코랩의 프로그램 작성 단위이며 일반 프로그램 파일과 달리 대화식으로 프로그램을 만들 수 있다. 코드, 코드의 실행 결과, 문서를 모두 저장하여 보관 가능
  • 코랩 노트북은 구글 클라우드의 가상 서버를 사용함
  • 레이텍: 수식, 그래프, 다이어그램 등을 그리는 데 유용한 문서 저작도구로 보통 논문 작성에 많이 사용됨

확인문제

  1. 2
  2. 4
  3. 3

마켓과 머신러닝

생선 분류 문제

  • 분류: 머신러닝에서 여러 개의 종류(혹은 클래스) 중 하나를 구별하는 문제
  • 이진 분류: 2개의 클래스 중 하나를 고르는 문제
  • 특성(feature): 데이터의 특징

  • 산점도: x, y축으로 이뤄진 좌표계에 두 변수의 관계를 표현하는 방법

첫 번째 머신러닝 프로그램

k-최근접 이웃 알고리즘이란?

  • 어떤 데이터에 대한 답을 구할 때 주위의 다른 데이터를 보고 다수를 차지하는 것을 정답으로 사용한다.
  • 데이터가 아주 많은 경우 사용하기 어렵다. 데이터가 크기 때문에 메모리가 많이 필요하고 직선거리를 계산하는 데도 많은 시간이 필요하기 때문이다.
  • 사실 어떤 규칙을 찾기보다는 전체 데이터를 메모리에 가지고 있는 것이 전부이다.

  • 사이킷런은 머신러닝 패키지이며 2차원 리스트가 필요하다.
  • 머신러닝 알고리즘이 생선의 길이와 무게를 보고 도미와 빙어를 구분하는 규칙을 찾기를 원한다. 그렇게 하려면 적어도 어떤 생선이 도미인지 빙어인지를 알려주는 정답 데이터를 준비해야 한다.

  • 파이썬에서 패키지나 모듈 전체를 임포트하지 않고 특정 클래스만 임포트하려면 from ~import 구문을 사용한다.
  • 모델에 데이터를 전달하여 규칙을 학습하는 과정을 훈련이라고 한다.

  • 맨허튼 거리와 유클리드 거리

  • 확인 문제
    1. 1
    2. 4
    3. 2
    4. n / fish_data, fish_target
This post is licensed under CC BY 4.0 by the author.