전체 글

Datascience

머신러닝 알고리즘의 성능 평가 지표(Evaluation Metric)

"The important thing isn't can you read music, it's can you hear it. Can you hear the music, Robert? Classfication Model Evaluation Metric 정확도(Accuracy) 오차행렬(Confusion Matrix) 정밀도(Precision) 재현율(Recall) F1 스코어 ROC AUC > 위에 나열된 성능지표들은 대체로 이진분류에서 더 강조하는 지표들 Accuracy HTML 삽입 미리보기할 수 없는 소스 "실제 데이터와 예측 데이터가 얼마나 같은가?" 를 표현한 하는 판단 지표 그러나 정확도는 데이터셋의 분포에 따라 왜곡을 발생시킬 수 도 있다. 특히 데이터 분포도가 균일하지 않은 경우 높은 수치가 ..

Datascience

Data Preprocessing : Label Encoding * One hot Encoding

Label Encoding - 사이킷런의 LabelEncoder 클래스로 구현할 수 있다. LabelEncoder 또한, 다른 sklearn 객체와 같이, 객체 생성 후 fit, transform 호출하며 진행 from seaborn import load_dataset from sklearn.preprocessing import LabelEncoder penguin_df = load_dataset("penguins") encoder = LabelEncoder() #LabelEncoder 또한, 다른 sklearn 객체와 같이, 객체 생성 후 fit, transform 호출하며 진행 encoder.fit(penguin_df["species"]) labels = encoder.transform(penguin..

Datascience

Skit- Learn의 기반 프레임워크 익히기

Skit- Learn의 기반 프레임워크 익히기 지도학습의 주요 두 축인 부류(Classification)과 회귀(Regression)의 다양한 알고리즘을 구현하는 과정에서 fit(), predict()을 활용하여 간단하게 학습과 예측 결과를 반환한다. Estimator 클래스 Estimator = Classifer(분류 알고리즘 sklearn 클래스) + Regression(회귀 알고리즘 on sklearn) - 내부에서 각각 fit과 predict를 구현하고 있음 - evaluation 함수(cross_val_score( ) 등), GridSearchCV와 같은 하이퍼 파라미터 튜닝을 지원하는 클래스 등에서 Estimator를 인자로 받음 (함수 내에서 인자로 받은 Estimator의 fit( )과 p..

Datascience/Python

[Python] #4 튜플과 딕셔너리 자료형

"Life is too short, You need Python." 튜플 자료형 (Tuple) ★ 튜플 vs 리스트 - 리스트는 [ ]으로 둘러싸지만, 튜플은 ( )으로 둘러싼다 - 리스트는 그 값의 생성, 삭제, 수정이 가증하지만, 튜플은 그 값을 바꿀 수 없다. → "프로그램이 실행되는 동안 그 값이 항상 변하지 않기를 바랃나거나 값이 바뀔까 걱정하고 싶지 않다면 주저하지 말고 튜플을 사용해야 한다!" t1 = () # 1개의 요소만 가질 때는 요소 뒤에 콤마를 반드시 붙여야 한다 t2 = (1,) t3 = (1, 2, 3) # 괄호를 생략할 수 도 있다 t4 = 1, 2, 3 t5 = (1, 2, ( 1, 3)) 튜플 다루기 t1 = (1, 2, 'a', 'b', 'c') # 인덱싱 t1[0] #>..

Datascience/Python

[Python] #3 문자열 자료형

"Life is too short, You need Python." 문자열 자료형 "Life is too short, You need Python" 'Life is too short, You need Python' """Life is too short, You need Python""" '''Life is too short, You need Python''' #여러 줄인 문자열 """ Life is too short You need Python """ "Life is too short \n You need Python" #이스케이프 코드 \n의 활용 문자열 연산하기 # 문자열 더하기 head = "apple" tail = " is good" head + tail #"apple is good" 출력 # 문..

Datascience/Python

[Python] #2 숫자 자료형

"Life is too short, You need Python." 정수형(Integer) - 정수를 뜻하는 자료형, 양의 정수 + 음의 정수 + 0 실수형(Floating-point) - 소수점이 포함된 숫자 a = 1.2 b = -3.14 #컴퓨터식 지수 표현 방식의 활용 c = 4.24E10 d = 4.24e-10 8진수(Octal)와 16진수(Hexadecimal) - 8진수 : 0o 또는 0O를 이용하여 표현 - 16진수 : 0x로 표현 a = 0o177 b = 0x8ff 숫자형 자료형 응용 - 연산자 #제곱 연산자 ** a = 3 b = 4 a ** b = #나머지 반환 연산자 % #몫 반환 연산자 //

Datascience/Python

[Python] #1 기초 문법 예제

"Life is too short, You need Python." 파이썬 기초 문법 예제 사칙 연산 #덧셈 1 + 2 #곱셈 3 * 9 #나눗셈 2 / 4 #IF 조건문 a = 3 if a> 1: print(" a is greater than 1") #for 반복문 for a in [1, 2, 3] print(a) # 1 2 3이 순서대로 출력 #while 반복문 i = 0 while i < 3: i = i + 1 print(i) # 1, 2, 3이 출력 #함수 선언 def add(a, b): return a+b

暗室

암실 #2

hchanryu
데사하는 펭귄