전체 글 462

데이터 구조 - (1) 자료구조, 알고리즘, 재귀

ㅈ자료구조 데이터를 저장, 조직, 관리할 때 사용하는 방법을 말한다. 컴퓨터 프로그래밍 언어에서는 효율적인 데이터의 형태를 사용하는 것이 중요하다. ​ 출처 : 쉽게 배우는 자료구조 with 파이썬 ​ 자료구조는 아래와 여러 종류로 나뉘어진다. 출처 : 쉽게 배우는 자료구조 with 파이썬 ​ ​ 동일한 type을 가지는 배열, 리스트 중간에 데이터를 삽입하거나 삭제할 때 사용하는 링크드 리스트, 행과 열을 가진 2차원 데이터를 사용할 때는 행렬, LIFO 방식의 스택, FIFO 방식의 큐 등 다양한 형태가 있다. 자료구조와 알고리즘 자료구조는 부품으로, 알고리즘은 설계도 정도로 표현할 수 있다. 이 둘이 합쳐져 완성품 즉 프로그래밍 언어로 나타낼 수 있다. ​ 알고리즘은 자연어, 순서도, 프로그래밍 언..

대학교 2023.09.11

EDA - 3단계 : 캐글 스터디(with TAVE 12기)

스터디 9월 16일 토요일부터 TAVE 12기 과정을 통해 10월 30일 정도까지 매주 토요일에 스터디를 2시간씩 진행할 예정이다. ​ 데이터 분석 분야의 스터디는 머신러닝과 캐글, 데이터 분석 기초로 총 3개로 분류되었고, 그중에서 Level 1과 2로 또 나뉘게 된다. 머신러닝과 캐글 둘 중에서 고민을 하였고, 캐글로 선택하였다. 전반기는 스터디를 진행하고, 후반기에는 프로젝트 혹은 공모전 등을 참여할 예정에 있다. ​ 아직 스터디 경험이나 프로젝트 경험이 적기 때문에 어려운 과정을 하기 보다는 어떻게 진행되는지 그 과정을 중심으로 배우려고 한다. 스터디 진행 위의 책을 기반으로 하고, 추가로 인프런이나 유튜브 강의 영상 등을 참조하여 스터디를 진행하기로 했다. ​ 현재 대강 7주차까지의 주차별 계획..

[알고리즘] 백준 25192 파이썬 - 인사성 밝은 곰곰이

25192번: 인사성 밝은 곰곰이 첫번째 새로운 사람이 들어온 뒤 pjshwa, chansol, chogahui05은 모두 곰곰티콘으로 인사했다. 두번째 새로운 사람이 들어온 뒤 pjshwa와 chansol은 다시 곰곰티콘으로 인사했다. www.acmicpc.net 문제 알고리즘 입문방 오픈 채팅방에서는 새로운 분들이 입장을 할 때마다 곰곰티콘을 사용해 인사를 한다. 이를 본 문자열 킬러 임스는 채팅방의 기록을 수집해 그 중 곰곰티콘이 사용된 횟수를 구해 보기로 했다. ENTER는 새로운 사람이 채팅방에 입장했음을 나타낸다. 그 외는 채팅을 입력한 유저의 닉네임을 나타낸다. 닉네임은 숫자 또는 영문 대소문자로 구성되어 있다. 새로운 사람이 입장한 이후 처음 채팅을 입력하는 사람은 반드시 곰곰티콘으로 인사..

[알고리즘] 백준 2776 파이썬 - 암기왕

2776번: 암기왕 연종이는 엄청난 기억력을 가지고 있다. 그래서 하루 동안 본 정수들을 모두 기억 할 수 있다. 하지만 이를 믿을 수 없는 동규는 그의 기억력을 시험해 보기로 한다. 동규는 연종을 따라 다니며, www.acmicpc.net 문제 연종이는 엄청난 기억력을 가지고 있다. 그래서 하루 동안 본 정수들을 모두 기억 할 수 있다. 하지만 이를 믿을 수 없는 동규는 그의 기억력을 시험해 보기로 한다. 동규는 연종을 따라 다니며, 연종이 하루 동안 본 정수들을 모두 ‘수첩1’에 적어 놓았다. 그것을 바탕으로 그가 진짜 암기왕인지 알아보기 위해, 동규는 연종에게 M개의 질문을 던졌다. 질문의 내용은 “X라는 정수를 오늘 본 적이 있는가?” 이다. 연종은 막힘없이 모두 대답을 했고, 동규는 연종이 봤다..

[일상] 2학기 개강 및 다짐

OT 오늘은 9월 4일 월요일 개강 첫 날로, 데이터 구조, 한국근현대사의이해, 미적분학1을 들었다. ​ 데이터 구조는 전공답게 OT와 수업 진도를 병행하여 2시간을 채웠다. 나머지 2과목은 교양이라 첫 날은 OT를 위주로 하고 수업을 마쳤다. 그래서 오늘 5시까지 수업이 있지만 오후 2시 30분에 수업이 끝났다. 수업이 끝나고 바로 교재를 인터넷으로 주문하거나 서점에서 구입했다. ​ 내일은 파이썬과 마이크로프로세서, 자바의 첫 수업을 한다. 각 과목에 대한 나의 생각 데이터 구조는 스택, 큐와 같은 자료구조 및 알고리즘에 관련된 내용을 배우기에, 평소 백준으로 학습했던 내용과 상당 부분 겹칠 것 같기에 무리없이 배울 수 있을 것 같다. ​ 파이썬은 주 언어로 사용하기에 따로 걱정은 하지 않고 있고, 자..

일상 2023.09.05

[일상] 대학 수강신청 (With TAVE 12기)

수강신청 8월 22일 화요일 아침 10시에 수강신청을 진행했다. 요즘은 네이버에서 서버 시간을 확인할 수 있어서 이 시간을 활용했다. 수강신청을 준비하다보니, 수강신청 연습 사이트도 있었다. 그래서 처음으로 연습을 하고 수강신청을 했는데 ​ 결과는 ... 올클이다. 대학교 와서 처음으로 올클을 했다. 물론 올클을 위해서 경쟁률이 낮은 과목을 위주로 시간표를 짜긴했다. 그래도 원하는 과목을 들을 수 있어서 다행이다. ​ 개강은 9월 1일 금요일로 금공강인 나는 9월 3일에 자취방으로 갈 예정이다. 동아리 최근 동아리 준비하면서 블로그 포스팅과 깃허브 잔디 채우기를 많이 안 했다. 그래도 결과가 좋게 나와서 다행이다. 한 곳은 1차가 붙었는데 이번에 최종으로 붙은 TAVE를 더 가고 싶어서 면접을 보지 않았..

일상 2023.08.29

EDA - 2단계 : 실제 데이터 다루기 (5)

- 출처 빅데이터 연합 동아리 BITAmin : 네이버 카페 빅데이터 연합 동아리 비타민입니다. cafe.naver.com 6기 멤버 코테 내용이다. 주피터 노트북을 환경으로 했다. - 문제1 a = 10 b = (1.44,'bitamin') c = "비타민" d = [1, 2, 3, 4, 5] e = {'특별시':'천안','충남':'서울','인천':'광역시'} a, b, c, d, e의 데이터에 대한 타입(type)을 출력하시오. 그리고 주석을 이용해 그 타입에 대한 설명을 간략히 하시오. ​ 풀이 : print(type(a)) print(type(b)) print(type(c)) print(type(d)) print(type(e)) - 문제2 score = [90,25,67,45,80] score는 ..

EDA - 2단계 : 실제 데이터 다루기 (4)

- 출처 빅데이터 연합 동아리 BITAmin : 네이버 카페 빅데이터 연합 동아리 비타민입니다. cafe.naver.com 11기 멤버 코테 내용이다. 주피터 노트북을 환경으로 했다. - 문제1 문제 1 - 20점 ​ 문제 [1-1] - 3점 ​ 2023년 1월 29일, 자신의 이름, MBTI, 핸드폰 번호 뒷자리를 리스트로 저장하고 그것을 Series의 형태로 변환하여 출력하세요 list=['2023-01-29','홍길동','ESFP',0123] pd.Series(list) 문제 [1-2] - 3점 ​ 딕셔너리를 사용하여 다음의 DataFrame 모양을 만들어 출력하세요.(DataFrame은 df로 저장해주세요) data={'사람1':[95,100,90,80],'사람2':[85,85,90,100],'사..

EDA - 2단계 : 실제 데이터 다루기 (3)

- 출처 빅데이터 연합 동아리 BITAmin : 네이버 카페 빅데이터 연합 동아리 비타민입니다. cafe.naver.com 10기 멤버 코테 내용이다. 주피터 노트북을 환경으로 했다. - 문제1 1. midwest.csv를 불러와 midwest에 저장하고, 위에서부터 10행까지 출력하시오. midwest=pd.read_csv("midwest.csv") midwest.head(10) 2. popwhite는 해당 지역의 아시아인 인구, poptotal은 해당 지역의 전체 인구를 나타냅니다. midwest 데이터에 '전체 인구 대비 아시아인 인구 백분율' 변수인 percent 열을 추가하세요. midwest['percent']=(midwest['popwhite'])/midwest['poptotal']*100 ..

EDA - 2단계 : 실제 데이터 다루기 (2)

- 출처 빅데이터 연합 동아리 BITAmin : 네이버 카페 빅데이터 연합 동아리 비타민입니다. cafe.naver.com 멤버 9기 코딩 테스트 문제입니다. 환경은 주피터 노트북입니다. - 문제1 1번 tips 에서 day 열값 분포를 구하세요. 수치형 데이터의 요약 (평균, 사분위 수 등)을 구하시오. tips['day'].value_counts() tips.describe() 2번 sex 별 tip 의 최댓값을 구하세요. Hint: loc[ ] male=tips['sex']=="Male" female=tips['sex']=="Female" max_male=tips['tip'].loc['male'].max() max_female=tips['tip'].loc['female'].max() 3번 total..