일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- S3
- 2020년
- 메세지큐
- billing
- AWS
- HEXO
- serverless
- React
- AWSKRUG
- Leetcode
- CloudWatch
- 백준
- API Gateway
- 맥주
- 아키텍처
- 노션
- 회고
- Notion
- 하이트진로
- zookeeper
- 머신러닝
- finops
- 알고리즘
- github pages
- Kafka
- ddd
- 도메인 주도 설계
- amqp
- LAMBDA
- Zappa
- Today
- Total
인생은 고통의 연속
Machine Learning - ML로 전환하기(이전 포스트) 본문
반응형
2018-08-27 작성
본 게시물은 구글 머신러닝 단기집중과정 스터디을 참고하여 작성되었습니다.
ML로 전환하기
- ML로 전환하기?
- 주어진 데이터를 통해서 선형 모델을 만들라는 것(=선형회귀!)
- 어떤 문제를 회귀화 기본적인 Flow(흐름)을 파악하자 - Step by Step!
선형 회귀
- 제일 먼저, 데이터를 그래프로 만들어 검토해야한다
- 왜냐? 데이터가 잘못되면 우리가 원하는 모델을 얻을 수 없기 때문!
- 예시) 온도별 1분당 귀뚜라미가 우는 횟수
- 나는 귀뚜라미가 몇번 우는지를 통해서 온도를 알고 싶다!
- 데이터를 먼저 좌표로 나타낸다
데이터간의 관계를 보면 온도와 1분당 우는 횟수는 서로 비례하는 관계를 가짐
따라서, 이 관계를 근사치로 표현할 수 있는 단 하나의 직선을 만들어 낼 수 있음 - 두번째 데이터간의 관계를 근사치로 표현한 직선
근사치로 표현한 직선이 모든 점(데이터)를 통과하지 않지만 대략적인 관계를 보여줌
이 그래프(관계)는 어떤 공식(모델의 방정식)으로 나타낼 수 있다 - 직선의 방정식
위에서 만든 직선을 수학적으로 공식화한 것- y : 온도, 예측하려는 값(우리가 알고 싶은 값)
- m : 선의 기울기
- x : 1분당 우는 횟수, 입력 특성 값(귀뚜라미가 1분에 100번 울었을때 온도를 알고 싶다면? x=100을 입력)
- b : y절편(직선이 y축과 만나는 점)
- 모델의 방정식
위에서 구한 직선의 방정식을 머신러닝의 관습에 맞게 작성한 방정식- y’ : 예측된 라벨(얻고자 하는 출력)
- w₁ : 특성1의 가중치. 가중치는 기울기와 같은 개념
- x₁ : 특성1(알려진 입력)
- b : 편향(y절편). w_0\이라고도 표현함
- 정교한 모델(여러 특성에 의존하는 모델)
만약에 귀뚜라미가 우는 시간/횟수, 나이 3가지 특성에 영향을 받는 경우에는 위와 같은 방정식이 나옴
반응형
'개발스터디&모임 > 구글 머신러닝 단기집중과정 스터디' 카테고리의 다른 글
Machine Learning - 손실 줄이기(이전 포스트) (0) | 2018.11.21 |
---|---|
Machine Learning - ML 문제로 표현하기(용어 정리)(이전 포스트) (0) | 2018.11.21 |
Machine Learning - 첫걸음(이전 포스트) (0) | 2018.11.21 |
Comments