인생은 고통의 연속

Machine Learning - ML로 전환하기(이전 포스트) 본문

개발스터디&모임/구글 머신러닝 단기집중과정 스터디

Machine Learning - ML로 전환하기(이전 포스트)

gnidoc 2018. 11. 21. 17:50
    반응형

    2018-08-27 작성


    본 게시물은 구글 머신러닝 단기집중과정 스터디을 참고하여 작성되었습니다.

    ML로 전환하기

    • ML로 전환하기?
      • 주어진 데이터를 통해서 선형 모델을 만들라는 것(=선형회귀!)
      • 어떤 문제를 회귀화 기본적인 Flow(흐름)을 파악하자 - Step by Step!

    선형 회귀

    • 제일 먼저, 데이터를 그래프로 만들어 검토해야한다
    • 왜냐? 데이터가 잘못되면 우리가 원하는 모델을 얻을 수 없기 때문!
    • 예시) 온도별 1분당 귀뚜라미가 우는 횟수
      • 나는 귀뚜라미가 몇번 우는지를 통해서 온도를 알고 싶다!
      • 데이터를 먼저 좌표로 나타낸다
        Figure 1 : 귀뚜라미가 온도에 따라 1분당 우는 횟수Figure 1 : 귀뚜라미가 온도에 따라 1분당 우는 횟수
        데이터간의 관계를 보면 온도와 1분당 우는 횟수는 서로 비례하는 관계를 가짐
        따라서, 이 관계를 근사치로 표현할 수 있는 단 하나의 직선을 만들어 낼 수 있음
      • 두번째 데이터간의 관계를 근사치로 표현한 직선
        Figure 2 : 근사치 그래프(선형 관계)Figure 2 : 근사치 그래프(선형 관계)
        근사치로 표현한 직선이 모든 점(데이터)를 통과하지 않지만 대략적인 관계를 보여줌
        이 그래프(관계)는 어떤 공식(모델의 방정식)으로 나타낼 수 있다
      • 직선의 방정식
        Figure 3 : 직선의 방정식Figure 3 : 직선의 방정식
        위에서 만든 직선을 수학적으로 공식화한 것
        • y : 온도, 예측하려는 값(우리가 알고 싶은 값)
        • m : 선의 기울기
        • x : 1분당 우는 횟수, 입력 특성 값(귀뚜라미가 1분에 100번 울었을때 온도를 알고 싶다면? x=100을 입력)
        • b : y절편(직선이 y축과 만나는 점)
      • 모델의 방정식
        Figure 4 : 모델의 방정식Figure 4 : 모델의 방정식
        위에서 구한 직선의 방정식을 머신러닝의 관습에 맞게 작성한 방정식
        • y’ : 예측된 라벨(얻고자 하는 출력)
        • w₁ : 특성1의 가중치. 가중치는 기울기와 같은 개념
        • x₁ : 특성1(알려진 입력)
        • b : 편향(y절편). w_0\이라고도 표현함
      • 정교한 모델(여러 특성에 의존하는 모델)
        Figure 5 : 3가지 특성에 의존하는 모델의 방정식Figure 5 : 3가지 특성에 의존하는 모델의 방정식
        만약에 귀뚜라미가 우는 시간/횟수, 나이 3가지 특성에 영향을 받는 경우에는 위와 같은 방정식이 나옴
    반응형
    Comments