728x90

통계학 3

26. TIL) 머신러닝의 이해와 라이브러리 활용 기초 2차시 - 머신러닝 & 로지스틱회귀

로지스틱회귀 이론범주형 Y에서 선형함수의 관계X가 연속형 변수이고, Y가 특정 값이 될 확률이라고 설정한다면, 왼쪽 그림과 같이 선형으로 설명하기는 쉽지 않음. 확률은 0과 1사이인데, 예측 값이 확률 범위를 넘어갈 수 있는 문제가 발생S자 형태의 함수를 적용하면 설명됨- Y가 0, 1 범주형인 경우 함수 적합 로짓의 개념S형태의 함수를 만들기 위해서 오즈비(Odds ratio)의 개념을 적용. 승산비라 불리는 오즈비는 실패확률 대비 성공확률로, 도박사들이 자주 쓰는 개념예를 들어 도박이 성공할 확률이 80% 라면, 오즈비는 80%/20% = 4. 1번 실패하면 4번은 딴다.오즈비(odds ratio) =  P/(1-P)하지만 오즈비는 바로 쓸 수 없음. P는 확률 값으로 0, 1 사이 값인데, P가 증..

카테고리 없음 2025.01.22

24. TIL) 통계학 5&6차시 / 아티클 스터디 - 실시간 공정데이터 기반 품질고도화 핵심기술 개발

5차시5.1 피어슨 상관계수피어슨 상관계수란?두 연속형 변수 간의 선형 관계를 측정하는 지표값은 -1에서 1 사이로, 1은 완전한 양의 선형 관계, -1은 완전한 음의 선형 관계, 0은 선형 관계가 없음을 의미예시: 첫 번째 그래프에서는 X와 Y가 강한 양의 선형 관계를 가지며, 상관계수는 0.99사용 시기선형적인 관계가 예상될 때 사용 (예: 공부 시간과 시험 점수 간의 상관관계 분석)비선형 관계에는 사용하지 않음import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom scipy.stats import pearsonr# 예시 데이터 생성np.random.seed(0)study_hours = n..

카테고리 없음 2025.01.20

21. TIL) 통계학 1차시

오늘부터는 새롭게 통계학, 머신러닝에 대해서 공부해보고자 한다일단 처음엔 통계학부터 차근차근 짚어보자1.1 데이터 분석에 있어서 통계가 중요한 이유데이터 기반의 의사결정을 내릴 수 있다통계는 데이터 분석의 핵심. 데이터를 기반으로 패턴을 이해하고, 이를 통해 논리적이고 효과적인 결정을 내릴 수 있다. 기업은 이러한 통계를 활용해 더욱 현명한 선택을 하고, 더 나은 결과를 도출할 수 있음1) 통계가 중요한 이유☑️ 데이터를 분석하고 이를 바탕으로 결정을 내릴 수 있다데이터를 이해하고 해석통계는 데이터의 본질을 파악하고 의미 있는 결과를 추출하는 데 필수적데이터 요약 및 패턴 발견방대한 데이터를 요약하고 중요한 패턴을 쉽게 발견할 수 있도록 도움결론 도출 지원통계적 추론 과정을 통해 데이터 기반으로 결론을 ..

카테고리 없음 2025.01.15