데이터다루기 15

EDA - 1단계 : 데이터 다루기 - 정렬, 결합

- 과거 내용 EDA - 1단계 : 데이터 다루기 - 비교, 필터링, 결측치 과거 내용 DataFrame - 비교, 필터링 1. 비교 40보다 큰 값은 True, 작거나 같은 값은 False로 나온다.... blog.naver.com - DataFrame - 정렬 1. 값 정렬 #원본 데이터 col1 col2 col3 row1 -3 A 7 row2 C 36 row3 5 D -5 #값 정렬 print(df.sort_values(by=['col1'],axis=0,ascending=True)) col1 col2 col3 row1 -3 A 7 row3 5 D -5 row2 C 36 by는 어떤 부분을 정렬할 지 선택하고, axis는 행과 열을 선택하고, ascending은 True일 때 오름차순, False일 ..

EDA - 1단계 : 데이터 다루기 - 비교, 필터링, 결측치

- 과거 내용 EDA - 1단계 : 데이터 다루기 - 함수 적용, 인덱싱 과거 내용 DataFrame - 함수 적용 1. apply 축 기준이 불가한 경우 개별 적용하여 결과값을 출력한다. 옵... blog.naver.com - DataFrame - 비교, 필터링 1. 비교 #원본 데이터 col1 col2 col3 row1 10 20 30 row2 40 50 60 row3 70 80 90 #값 비교(True or False) print(df.gt(40)) col1 col2 col3 row1 False False False row2 False True True row3 True True True 40보다 큰 값은 True, 작거나 같은 값은 False로 나온다. 이외에도 lt, ge, le, eq, ne가..

EDA - 1단계 : 데이터 다루기 - 함수 적용, 인덱싱

- 과거 내용 EDA - 1단계 : 데이터 다루기 - 객체 내 연산 과거내용 DataFrame - 객채 내 연산 1. 반올림 0은 일의자리까지 반올림, n은 소수n번째 자리까지 반올림... blog.naver.com - DataFrame - 함수 적용 1. apply #원본 데이터 col1 col2 col3 row1 1 2 3 row2 4 5 6 row3 7 8 9 #개별 적용 df=df.apply(np.sqrt) col1 col2 col3 row1 1.000000 1.414214 1.732051 row2 2.000000 2.236068 2.449490 row3 2.645751 2.828427 3.000000 #축 기준 적용 df=dp.apply(np.sum) col1 12 col2 15 col3 18 ..

EDA - 1단계 : 데이터 다루기 - 객체 내 연산

- 과거내용 EDA - 1단계 : 데이터 다루기 - 객체 간 연산 과거 내용 Dataframe - 객체 간 연산 데이터를 원하는 데로 다룰 수 있어야 더 좋은 분석을 할 수 있다. ... blog.naver.com - DataFrame - 객채 내 연산 #원본 데이터 data=[[1.25,2.23],[3.21,4.56]] col=['col1','col2'] row=['row1','row2'] df = pd.DataFrame(data=data, index=row, columns=col) 출력 col1 col2 row4 1.25 2.23 row5 3.21 4.56 1. 반올림 #반올림 df.round(0) df.round(1) 출력 col1 col2 row4 1.0 2.0 row5 3.0 5.0 col1 c..

EDA - 1단계 : 데이터 다루기 - 객체 간 연산

- 과거 내용 데이터 분석 - EDA(탐색적 데이터 분석) 개념 EDA 쉽게 말하면 초기 데이터를 조사하고 주요 특징을 찾아 어떻게 분석해나갈지 찾아가는 데이터 분석... blog.naver.com - Dataframe - 객체 간 연산 데이터를 원하는 데로 다룰 수 있어야 더 좋은 분석을 할 수 있다. 그렇기에 지금부터 Dataframe을 다루는 연습을 할 것이다. ​ - 원본 데이터 data=[[1,2],[3,4],[5,6]] col=['col1','col2'] row=['row4','row5','row6'] df = pd.DataFrame(data=data, index=row, columns=col) 출력 col1 col2 row4 1 2 row5 3 4 row6 5 6 1. 더하기 #스칼라 값 더..