Home
김예나
Cancel

[혼공머신러닝 4–2] 로지스틱 손실 함수와 확률적 경사 하강법

1. 손실함수란 이 장에서는 확률적 경사 하강법과 손실함수라는 새로운 개념에 관해 배웠는데, 이런 개념을 도입한 까닭은 계속해서 새로운 데이터가 추가되어 매번 모든 데이터를 가지고 학습할 수 없는 경우, 새로운 방법이 필요하기 때문입니다. 그래서 제시된 것이 확률적 경사 하강법이며, 확률적 경사 하강법을 적용하기 위해서는 손실 함수가 반드시 필요합니...

[혼공머신러닝 4–1] 최근접 이웃 분류기와 로지스틱 회귀

최근접 이웃 분류에 관해 말하기에 앞서, 데이터를 준비합시다. import pandas as pd fish = pd.read_csv('https://bit.ly/fish_csv_data') fish.head() # 앞에 있는 다섯 개의 데이터 보여줌 fish_input = fish[['Weight','Length','Diagonal','Heigh...

릿지와 라쏘

현재 공부하고 있는 책인 혼공머신러닝에서는 릿지와 라쏘의 이론에 관한 이야기를 가볍게 언급만 하고 넘어갔기에 핸즈온 머신러닝 책을 참고하여 부족한 내용을 보충하며 이해하고자 합니다. 다음 링크는 핸즈온 머신러닝의 구글북스로 연결됩니다. https://books.google.co.kr/books?id=k5daDwAAQBAJ&printsec=fr...

Jekyll Chripy Google Analytics 연동하기

다른 Jekyll 테마는 어떨지 잘 모르겠는데, Chripy 테마에서는 ga4 연동이 어렵지 않았습니다. Chripy demo 블로그에 들어가보면 설정하는 법이 나와 있습니다. https://chirpy.cotes.page/posts/enable-google-pv/ 1. Google Analytics에 관리자 계정 만들기 https://analy...

[혼공머신러닝 03-3]특성 공학과 규제

1. pandas로 데이터 불러오기 특성 공학과 규제에 관해 배우기에 앞서, pandas를 이용해 데이터를 불러오는 방법을 먼저 학습하였습니다. import pandas as pd # 데이터프레임, csv 관리 df = pd.read_csv('https://bit.ly/perch_csv_data') perch_full = df.to_numpy() ...

Jekyll 블로그에 utterances 댓글창 만들기

블로그에 댓글창을 만들기 위해 사용할 수 있는 것들을 알아보니 disqus, utterances, giscus가 있었습니다. disqus는 부분 유료화와 오래 사용하면 광고가 붙는 등의 문제가 있다고 해서 패스하고, 당시에는 giscus의 존재를 몰랐기 때문에 utterances를 고르게 되었습니다. utterances는 github의 issues에 ...

pandas를 이용한 데이터 전처리하기

최근에 그동안 배웠던 것을 토대로 데이콘에서 데이터 예측 문제에 도전하고 있는데 그간 열심히 공부했던 것이 무색하게도 pandas의 메서드를 잘 알지도 못하고 데이터를 직접 전처리해본 일이 없었기 때문에 이 단계에서 한참을 헤멨습니다. 그래서 두 번은 헤메지 않으려 이번에 공부한 내용을 기록해 두려 합니다. 1. 데이터 불러오기 import pan...

Jekyll Chripy 테마 코드블럭 하이라이팅

얼마 전 블로그에 글을 쓰는 것에 관해, 코드블럭을 하이라이팅하라는 조언을 듣고 그 방법을 이리저리 찾아보았는데, 이상하게도 분명 코드블럭에는 python이라고 명시가 되어있는데 하이라이팅은 되지 않고 있었다는 사실을 발견했습니다. 이것이 저 개인의 문제였는지, 아니면 애초에 커스텀을 위해 남겨진 부분인지는 모르겠지만 이런 이유로 오늘은 코드블럭을 하...

선형 회귀와 결정계수

본격적으로 수학적인 이야기를 하기에 앞서, 혼공머신러닝 책을 통해 공부하면서 궁금했던 점을 이번 기회에 해결하게 되었기에 가볍게 언급하고 넘어가볼까 합니다. 그럼, 이야기를 시작해 보겠습니다. 1. 선형이란? 선형 회귀와 다항 회귀를 공부하면서, E(y) = ax² + bx + c와 같은 식이 어떻게 선형으로 불릴 수 있는지에 관해 의문이 들었습니...

[혼공머신러닝 03-2]k-최근접 이웃 회귀의 한계, 선형 회귀와 다항 회귀

k-최근접 이웃 회귀는 예측하고자 하는 데이터가 훈련 세트의 범위를 벗어난 경우 제대로 된 예측을 하지 못한다는 문제점이 있습니다. 따라서 이전까지 훈련 세트의 농어 길이 최대치가 45 안팎이었으므로, 길이 50의 농어나 길이 100의 농어를 예측하고자 해도 근처의 데이터가 45 이전의 데이터이므로 그것들의 평균치를 예측치로 갖게 됩니다. 이 때문에...