본문 바로가기

전체 글22

[ML - lec 02,03] Linear Regression의 Hypothesis와 cost 본 내용은 김성훈 교수님의 '모두를 위한 딥러닝' 강의와 https://pythonkim.tistory.com/notice/25 를 참고하여 제작하였습니다. 목차 용어 정리 What hypothesis is better? Cost function Cost 최소화 알고리즘의 원리 설명 Gradient descent algorithm 용어 정리 본 강좌 내용을 학습하기에 앞서서 먼저 몇 가지 용어에 대한 정리가 필요합니다. 1. 회귀분석 점들이 퍼져있는 형태에서 패턴을 찾아내고, 이 패턴을 활용해서 무언가를 예측하는 분석. 새로운 표본을 뽑았을 때 평균으로 돌아가려는 특징이 있기 때문에 붙은 이름. 회귀(回歸 돌 회, 돌아갈 귀)라는 용어는 일반적으로 '돌아간다'는 정도로만 사용하기 때문에 회귀로부터 '예측.. 2022. 3. 6.
[ML-분류] 앙상블 학습(Ensemble Learning) 본 내용은 'Python ML Perfect Guied' 서적을 바탕으로 학습하기 위해 작성하였습니다. 목차 앙상블 학습(Ensemble Learning) 이란? 앙상블 학습(Ensemble Learning)의 특징 앙상블 학습(Ensemble Learning)의 유형 보팅(Voting) 하드 보팅(Hard Voting) 소프트 보팅(Soft Voting) 배깅(Bagging) 랜덤 포레스트(Random Forest) 부스팅(Boosting) AdaBoost GBM(Gradient Boosting Machine) 앙상블 학습(Ensemble Learning) 이란? 여러 개의 분류기(Classifier)를 생성하고 그 예측을 결합함으로써 보다 정확한 예측을 도출하는 기법을 말합니다. 예를 들어 어려운 문.. 2022. 2. 4.
2. Greedy Algorithm(그리디 알고리즘) 실전문제 ※ 본 자료는 '이것이 코딩 테스트다 with Python - 나동빈' 서적을 바탕으로 학습하기 위해 작성하였습니다.※ 1. 기출: 2019 국가 교육기관 코딩 테스트 '큰 수의 법칙'은 일반적으로 통계 분야에서 다루어지는 내용이지만, 이 책에서는 색다른 방식으로 다르게 사용하고 있습니다. 이 책에서는 다양한 수로 이루어진 배열이 있을 때 주어진 수들을 M번 더하여 가장 큰 수를 만드는 법칙 입니다. 단, 배열의 특정한 인덱스(번호)에 해당하는 수가 연속해서 K번을 초과하여 더해질 수 없는 것이 이 법칙의 특징입니다. 예를 들어 순서대로 2, 4, 5, 4, 6으로 이루어진 배열이 있을 때 M이 8이고, K가 3이라고 가정해봅시다. 이 경우 특정한 인덱스의 수가 연속해서 세 번까지만 더해질 수 있으므로 .. 2022. 1. 30.
1. Greedy Algorithm(그리디 알고리즘) ※ 본 자료는 '이것이 코딩 테스트다 with Python - 나동빈' 서적을 바탕으로 학습하기 위해 작성하였습니다.※ https://youtu.be/_TG0hVYJ6D8 그리디 알고리즘(탐욕 법)은 현재 상황에서 지금 당장 좋은 것만 고르는 방법을 의미합니다. 일반적인 그리디 알고리즘은 문제를 풀기 위한 최소한의 아이디어를 떠올릴 수 있는 능력을 요구합니다. 그리디 해법은 그 정당성 분석이 중요합니다. 단순히 가장 좋아 보이는 것을 반복적으로 선택해도 최적의 해를 구할 수 있는지 검토합니다. 루트 노드부터 시작하여 거쳐 가는 노드 값의 합을 최대로 만들고 싶습니다. Q. 최적의 해는 무엇인가요? 애초에 노드의 수가 별로 없어서 눈으로 봐도 최적의 해를 알 수 있습니다. 5 > 7 > 9 이 순서로 이동.. 2022. 1. 28.