Github Actions를 이용한 잔디심기 대쉬보드 만들기를 하면서 cron: ‘0 1 * * *‘라는 코드의 이해를 위해 cron 표현식을 잠깐 공부했었습니다. cron 표현식을 키워드로 검색하면 대부분 7자리 표현식이 나오는데, 거기서 연도를 생략해 6자리로 많이 사용하는 것 같습니다. ‘그런데 이 코드는 왜 5자리지…?’ 알고 보니 리눅스에...
[혼공머신러닝 5–3] 트리의 앙상블
앞선 장에서 결정 트리에 관해 공부했는데, 이번 장에서는 그 트리들을 앙상블한 네 가지 알고리즘에 관해 배웠습니다. 1. 랜덤 포레스트 랜덤 포레스트는 랜덤한 결정 트리들로 숲을 구성한 앙상블입니다. 각각의 결정 트리를 위한 데이터는 랜덤하게 구성되는데, 이때 각각의 데이터는 부트스트랩 샘플입니다. 부트스트랩 샘플은 훈련 세트와 동일한 크기로 만드...
i.i.d 가정에 관한 고민
저번 스터디 시간에 i.i.d 가정에 관해 의문을 가진 분이 계셨는데, 정확한 질문은 경사 하강법에서 샘플이 independant를 만족하지 않을 수도 있다는 건 알겠지만, identically distributed을 만족하지 않게 될 수가 있느냐는 질문이었습니다. 당시에는 제대로 답변할 만큼 생각이 정리되지 않아 미뤄뒀기에 이제 제가 아는 것과 생각...
[혼공머신러닝 5–2] 교차 검증과 그리드 서치, 랜덤 서치
1. 검증 세트 우리는 그간 테스트 세트의 평가 값을 모델의 일반적인 성능으로 생각하고 사용해 왔는데, 모델의 하이퍼파라미터를 평가 값이 최대가 되는 곳에 맞췄을 때에는 모델이 테스트 세트에 잘 맞춰져 있는 것이지 일반적인 성능이 높다고 장담할 수가 없습니다. 이 문제를 해결하기 위해 검증 세트를 만들어야 합니다. 검증 세트를 만드는 법은 매우 간...
[혼공머신러닝 5–1] 결정 트리
이 책에서 결정 트리를 소개한 것은 로지스틱 회귀와 대비하여, 로지스틱 회귀의 훈련된 coef_와 intercept_ 값이 무엇인지는 볼 수 있어도 왜 그런 값을 도출하는지는 설명하기 어렵다는 점에 있었습니다. 결정 트리의 장점은 무엇을 기준으로 모델을 분류하는지 직관적으로 알 수 있다는 것입니다. 이제 우리는 결정 트리의 형태, 원리와 규제에 관해 ...
EC2 서버에서 Jupyter Notebook 구동하기
https://dataschool.com/data-modeling-101/running-jupyter-notebook-on-an-ec2-server/의 내용을 따라해보며 EC2 서버에서 Jupyter Notebook을 구동해보았습니다. 1. AWS 계정 만들기 https://aws.amazon.com/에서 계정을 생성합니다. 주소 입력, 이메일 인...
Github Actions를 이용한 잔디심기 대쉬보드 만들기
글을 본격적으로 시작하기에 앞서, 이 글은 https://github.com/yonsei-app-dev-club/yonsei-app-dev-club-2022의 코드를 그대로 사용하였음을 밝힙니다. 1. 레포지토리 생성하고 권한 설정하기 잔디심기 대쉬보드를 만들 레포지토리를 생성합니다. 이미 있는 레포지토리에 표시하고 싶다면 굳이 생성하지 않아도 됩...
선형 SVM 분류
혼공머신러닝에서 힌지 손실을 사용하는 모델로 SVM을 소개하였는데, 진도에 여유가 있는 김에 핸즈온 머신러닝 책을 통해 공부해 보았습니다. 1. 결정 경계 핸즈온 머신러닝에서는 SVM 분류 예제로 붓꽃(iris) 데이터셋을 사용합니다. 이 데이터셋의 타겟은 setosa, versicolor, virginica의 세 가지인데, 이진 분류의 수행을 위...
경사하강법
혼공머신러닝 책에서 이 경사하강법만큼은 비유적 설명을 통해 잘 설명하였기 때문에 이해가 잘 안 가는 부분이 거의 없었습니다. 다만, 경사하강법이 수학적으로 어떻게 작용하는지에 관해서는 의문이 들었기 때문에 이 부분만 다루어 보겠습니다. 1. 경사하강법의 수식 [\theta^{(next step)} = \theta-\eta \triangledown_...
로지스틱 회귀
이번 챕터에서도 조금 더 구체적이고 수학적인 이해를 위해 핸즈온 머신러닝 책과 지난 번에 명료한 설명이 좋았던 강의를 듣고 다시 정리를 해두려 합니다. 영상 출처를 첨부합니다. [핵심 머신러닝] 로지스틱회귀모델 1 https://www.youtube.com/watch?v=l_8XEj2_9rk&t=2s [핵심 머신러닝] 로지스틱회귀모델 2 ...