본문 바로가기

티스토리챌린지5

하이퍼 파라미터 튜닝 - 최고의 요리 레시피 찾기 최고의 요리 레시피 찾기이 프로젝트는 마치 최고의 요리 레시피를 찾기 위한 여정과 같습니다. 모델 성능을 극대화하려는 목표는 마치 손님이 모두 만족할 수 있는 완벽한 요리를 만들기 위한 시도와 비슷합니다.탐색 공간 정의 (xgb_search_space):요리 재료와 조리법을 선택할 범위를 정의하는 과정입니다.요리를 하기 전에 양념의 양, 재료의 비율, 조리 시간 등을 결정해야 하는데, 이 과정에서 가능한 선택지들의 범위를 정합니다. 예를 들어:max_depth는 조리 시간으로 비유할 수 있습니다. (너무 길면 과도하게 익혀져 버리지만, 짧으면 덜 익은 상태가 될 수 있습니다.)learning_rate는 불의 세기로 생각할 수 있습니다. (너무 세면 요리가 타버리고, 너무 약하면 익지 않습니다.)여기서, .. 2024. 11. 12.
선형 예측 모형과 역행렬 선형 예측 모형이란?   먼저 선형 예측 모형이란, 입력 데이터 벡터와 가중치 벡터의 내적을 계산하여 출력값을 예측하는 모델이에요. 여기서 내적은 "특성 값"과 "가중치"를 곱해서 모두 더하는 것을 의미해요. 예를 들어, 단순한 선형 회귀 모델이 있다면, 이 모델은 다음과 같은 형태로 표현됩니다:   여기서: 모델을 학습한다는 것은 가중치인 w값을 찾는 과정이에요.이 가중치 값을 잘 조정하면 예측 결과인 y가 실제 값에 더 가까워질 수 있습니다. 선형 연립방정식이란?선형 연립방정식은 여러 개의 선형 방정식들이 함께 모여 있는 방정식을 의미해요. 예를 들어, 다음과 같은 세 개의 선형 방정식이 있다고 해볼게요: 이와 같이 여러 개의 방정식을 한 번에 푸는 것을 선형 연립방정식이라고 해요. 행렬을 사용하여 .. 2024. 11. 10.
행렬의 부호 - 정부호, 준정부호, 부정부호 성질 행렬은 여러 개의 숫자로 이루어져 있으므로 실수처럼 부호나 크기를 정의하기 어렵다. 하지만 부호/크기와 유사한 개념은 정의할 수 있다. 여기에서는 이러한 개념을 살펴본다.행렬에는 "정부호(Positive Definite)"와 "준정부호(Semi-Definite)" 같은 개념이 있습니다. 이러한 개념들은 주로 대칭 행렬(Symmetric Matrix)과 관련이 있으며, 주로 선형대수학, 최적화 문제, 그리고 통계학에서 중요한 역할을 합니다.  1. 정부호 행렬 (Positive Definite Matrix)행렬 A가 정부호라는 것은, 어떤 비영벡터 x에 대해 다음 조건을 만족한다는 것을 의미합니다. 이 조건은 임의의 비영벡터 x에 대해 행렬 A가 정의하는 이차 형식이 항상 양수임을 나타냅니다. 정부호 행렬.. 2024. 11. 9.
[지도학습] 분류(Classificaion) - (1) 의사결정나무(Decision Tree) 모델 결정트리 (Decision Tree) 결정 트리(Decision Tree)는 ML 알고리즘 중 직관적으로 이해하기 쉬운 알고리즘 입니다.데이터에 있는 규칙 학습을 통해 자동으로 찾아내 트리(Tree) 기반의 분류 규칙을 만드는 것 입니다. 일반적으로 규칙을 가장 쉽게 표현하는 방법은 if/else 기반으로 나타나는 것인데 쉽게 생각하면 스무고개 게임과 유사하며 룰 기반으로 if/else를 자동으로 찾아내 예측을 위한 규칙을 만드는 알고리즘으로 이해하면 더 쉽게 다가 올 것 입니다. 따라서 데이터를 어떤 기준을 바탕으로 규칙을 만들어야 가장 효율적인 분류가 될 것인가가 알고리즘의 성능을 크게 좌우합니다.   결정 트리 구조  규칙 노드(Decision Node)는 규칙 조건이 되는 것이고, 리프 노드(Le.. 2024. 11. 8.
사이킷런(scikit-learn) 이란? *사이킷런(Scikit-learn)은 파이썬에서 머신러닝 및 데이터 분석을 위한 오픈 소스 라이브러리입니다. 간단한 인터페이스와 강력한 기능으로 머신러닝 모델 개발 및 데이터 전처리 과정을 쉽게 구현할 수 있도록 도와줍니다. 파이썬을 활용한 머신러닝 도구 데이터 분석(예측)을 위한 간단하고 효율적인 도구누구나 쉽게 다양한 상황에서 활용 가능오픈소스 사이킷런으로 할 수 있는 것- 분류 (ex. 스팸메일)- 회귀 (ex. 가격)- 클러스터링 (ex. 고객 세그먼트)- 차원축소 (ex. 변수(컬럼)의 수를 줄임)- 모델 선택 (ex. 모델 튜닝, 평가)- 전처리 (ex. 데이터 가공/변환) 1. Scikit-learn의 주요 특징(1) 다양한 알고리즘 지원사이킷런은 지도 학습과 비지도 학습을 포함하여 여러 머.. 2024. 11. 7.