개발자를 위한 실전 선형대수학(Practical Linear Algebra for Data Science) 4장 행렬, 파트 1 : 행렬과 행렬의 기본 연산 "행렬은 벡터를 한 차원 더 끌어올린 것입니다." 데이터 과학에서 다루는 행렬은 수십억 개의 원소를 가지는 대규모인 경우가 많다. 그렇기에 수식적인 표현보다는 maplotlib등의 라이브러리를 활용한 시각화 표현이 유리함. # create some matrices A = np.random.randn(3,4) B = np.random.randn(100,100) C = -toeplitz(np.arange(8),np.arange(10)) # and show them as images fig,axs = plt.subplots(1,3,figsize=(10,3..
개발자를 위한 실전 선형대수학(Practical Linear Algebra for Data Science) 3장 벡터 응용: 데이터 분석에서의 벡터 벡터와 벡터 연산이 데이터 과학에서 어떻게 사용되는가? 상관관계와 코사인 유사도 상관관계 상관관계는 통계와 머신러닝에서 가장 근본적이면서 중요한 분석 방법 상관계수(correlation coefficient): 두 변수 사이의 선형관계를 정량화한 하나의 숫자 → 정규화가 포함됨(단위의 영향 x, 상관계수가 기대하는 -1 ~ +1의 범위를 가지게 됨) -> 상관계수 계산에 포함된 두 정규화 1. 각 변수의 평균 중심화: 평균중심화는 각 데이터 값에서 평균값을 빼는 것 2. 벡터 노름 곱으로 내적을 나누기: 측정 단위를 제거하고 상관계수의 최대 크기를 1로 조정..
개발자를 위한 실전 선형대수학(Practical Linear Algebra for Data Science) 2장 벡터, 파트 2 : 벡터의 확장 개념 벡터 집합(set) - 벡터들의 모음, 대문자 이탤릭체로 표기 선형 가중 결합 - 선형 가중 결합 (linear weighted combination) : 여러 변수마다 가중치(또는 계수)를 다르게 주어 정보를 혼합하는 방법 = 선형 혼합(linear mixture), 가중 결합(weighted combination) - 선형 가중 결합은 단순하게 말하면 스칼라-벡터 곱셈을 한 다음 합을 하는 것 선형 독립성 - 벡터 집합에서 적어도 하나의 벡터를 집합의 다른 벡터들의 선형 가중 결합으로 나타낼 수 있을 때, 벡터 집합을 선형 종속적(linearly dep..
개발자를 위한 실전 선형대수학(Practical Linear Algebra for Data Science) 1장 벡터, 파트 1 : 벡터와 벡터의 기본 연산 정리 벡터는 선형대수학 전체의 초석이다. 벡터(Vector) : 순서대로 나열된 수 목록(ordered list of number) 차원(dimensionality) : 벡터가 가진 원소의 수(수학적 차원의 개념), (파이썬에서 벡터의 길이, 모양) ▶ 파이썬에서의 차원은 수 객체를 출력하는 데 사용되는 기하학적 차원의 수 방향(orientation) : 벡터의 원소들이 나열된 모양 ( 열 방향, 행 방향) 벡터의 기하학적 해석 - 벡터는 특정 길이(또는 크기)와 방향을 가진 직선 "벡터를 기하학적 또는 대수학적으로 개념화하는 것은 단순히 같은 것을..