Chapter 01. 인공지능과 머신러닝, 딥러닝
- 진도: 55~
- 이해되지 않는 부분 표시 , 중요한 부분 표시
나의 첫 머신러닝
인공지능과 머신러닝, 딥러닝
- 인공지능: 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템을 만드는 기술
- 인공일반지능 혹은 강인공지능: 흔히 영화 속의 인공지능
약인공지능: 현실에서 우리가 마주하고 있는 인공지능으로, 특정 분여에서 사람의 일을 도와주는 보조 역할만 가능하다.
- 머신러닝: 규칙을 일일히 프로그래밍하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야이다.
- 통계학에서 유래된 머신러닝 알고리즘이 많으며 통계학과 컴퓨터 과학 분야가 상호 작용하면서 발전하고 있다.
사이킷런: 컴퓨터 과학 분야의 대표적인 머신러닝 라이브러리
- 딥러닝: 많은 머신러닝 알고리즘 중에 인공 신경망을 기반으로 한 방법들을 통칭하여 부르는 말
- 딥러닝 라이브러리: 구글의 텐서플로, 페이스북의 파이토치
코랩과 주피터 노트북
- 셀: 코랩에서 실행할 수 있는 최소 단위
- 코랩: 구글 계정이 있으면 누구나 사용할 수 있는 웹 브라우저 기반의 파이썬 코드 실행 환경
- 노트북: 코랩의 프로그램 작성 단위이며 일반 프로그램 파일과 달리 대화식으로 프로그램을 만들 수 있다. 코드, 코드의 실행 결과, 문서를 모두 저장하여 보관 가능
- 코랩 노트북은 구글 클라우드의 가상 서버를 사용함
- 레이텍: 수식, 그래프, 다이어그램 등을 그리는 데 유용한 문서 저작도구로 보통 논문 작성에 많이 사용됨
확인문제
- 2
- 4
- 3
마켓과 머신러닝
생선 분류 문제
- 분류: 머신러닝에서 여러 개의 종류(혹은 클래스) 중 하나를 구별하는 문제
- 이진 분류: 2개의 클래스 중 하나를 고르는 문제
특성(feature): 데이터의 특징
- 산점도: x, y축으로 이뤄진 좌표계에 두 변수의 관계를 표현하는 방법
첫 번째 머신러닝 프로그램
k-최근접 이웃 알고리즘이란?
- 어떤 데이터에 대한 답을 구할 때 주위의 다른 데이터를 보고 다수를 차지하는 것을 정답으로 사용한다.
- 데이터가 아주 많은 경우 사용하기 어렵다. 데이터가 크기 때문에 메모리가 많이 필요하고 직선거리를 계산하는 데도 많은 시간이 필요하기 때문이다.
사실 어떤 규칙을 찾기보다는 전체 데이터를 메모리에 가지고 있는 것이 전부이다.
- 사이킷런은 머신러닝 패키지이며 2차원 리스트가 필요하다.
머신러닝 알고리즘이 생선의 길이와 무게를 보고 도미와 빙어를 구분하는 규칙을 찾기를 원한다. 그렇게 하려면 적어도 어떤 생선이 도미인지 빙어인지를 알려주는 정답 데이터를 준비해야 한다.
- 파이썬에서 패키지나 모듈 전체를 임포트하지 않고 특정 클래스만 임포트하려면 from ~import 구문을 사용한다.
모델에 데이터를 전달하여 규칙을 학습하는 과정을 훈련이라고 한다.
맨허튼 거리와 유클리드 거리
- 확인 문제
- 1
- 4
- 2
- n / fish_data, fish_target
This post is licensed under CC BY 4.0 by the author.