실제데이터다루기 3

EDA - 2단계 : 실제 데이터 다루기 (4)

- 출처 빅데이터 연합 동아리 BITAmin : 네이버 카페 빅데이터 연합 동아리 비타민입니다. cafe.naver.com 11기 멤버 코테 내용이다. 주피터 노트북을 환경으로 했다. - 문제1 문제 1 - 20점 ​ 문제 [1-1] - 3점 ​ 2023년 1월 29일, 자신의 이름, MBTI, 핸드폰 번호 뒷자리를 리스트로 저장하고 그것을 Series의 형태로 변환하여 출력하세요 list=['2023-01-29','홍길동','ESFP',0123] pd.Series(list) 문제 [1-2] - 3점 ​ 딕셔너리를 사용하여 다음의 DataFrame 모양을 만들어 출력하세요.(DataFrame은 df로 저장해주세요) data={'사람1':[95,100,90,80],'사람2':[85,85,90,100],'사..

EDA - 2단계 : 실제 데이터 다루기 (3)

- 출처 빅데이터 연합 동아리 BITAmin : 네이버 카페 빅데이터 연합 동아리 비타민입니다. cafe.naver.com 10기 멤버 코테 내용이다. 주피터 노트북을 환경으로 했다. - 문제1 1. midwest.csv를 불러와 midwest에 저장하고, 위에서부터 10행까지 출력하시오. midwest=pd.read_csv("midwest.csv") midwest.head(10) 2. popwhite는 해당 지역의 아시아인 인구, poptotal은 해당 지역의 전체 인구를 나타냅니다. midwest 데이터에 '전체 인구 대비 아시아인 인구 백분율' 변수인 percent 열을 추가하세요. midwest['percent']=(midwest['popwhite'])/midwest['poptotal']*100 ..

EDA - 2단계 : 실제 데이터 다루기 (1)

- 출처 빅데이터 연합 동아리 BITAmin : 네이버 카페 빅데이터 연합 동아리 비타민입니다. cafe.naver.com 8기 멤버 문제이다. 개발 환경은 주피터 노트북이다. - 문제1 1. iris의 species 열 값 분포를 확인하시오. iris['species'].value_counts() 결과 setosa 50 versicolor 50 virginica 50 Name: species, dtype: int64 2. species 별로 각 변수의 최댓값을 구하시오. iris.groupby('species').max() 결과 : ​ 3. iris의 species 열 값을 setosa는 1, 그 외의 값들은 0으로 변환하시오. (apply, lambda 사용) iris['species']=iris['..