전체 글 462

데이터 분석 - 데이터 정제(결측치 이상치 제거, 대체)

1. 빠진 데이터 찾기 결측치 : 누락된 값, 비어 있는 값을 의미한다. pandas - isna() : 결측치 확인(boolean값으로 반환) inna().sum() : 결측치 빈도 확인 dropna(subset=[]) : 결측치 제거 dropna() : 모든 변수에 결측치 제거 (꼭 필요할 때만 사용) 원본 코드 import pandas as pd import numpy as np df = pd.DataFrame({'sex':['M','F',np.nan,'M','F']}, 'score':[5,4,3,4,np.nan]) print(df) print(pd.isna(df)) print(pd.isna(df).sum()) print(df.dropna(subset=['score'])) print(df.dropn..

[알고리즘] 백준 1931 파이썬 - 회의실 배정

1931번: 회의실 배정 (1,4), (5,7), (8,11), (12,14) 를 이용할 수 있다. www.acmicpc.net 문제 한 개의 회의실이 있는데 이를 사용하고자 하는 N개의 회의에 대하여 회의실 사용표를 만들려고 한다. 각 회의 I에 대해 시작시간과 끝나는 시간이 주어져 있고, 각 회의가 겹치지 않게 하면서 회의실을 사용할 수 있는 회의의 최대 개수를 찾아보자. 단, 회의는 한번 시작하면 중간에 중단될 수 없으며 한 회의가 끝나는 것과 동시에 다음 회의가 시작될 수 있다. 회의의 시작시간과 끝나는 시간이 같을 수도 있다. 이 경우에는 시작하자마자 끝나는 것으로 생각하면 된다. 문제풀이 import sys input = sys.stdin.readline n=int(input()) tmp=[]..

데이터 분석-데이터 전처리 및 가공(feat. pandas)

1. 데이터 전처리 분석에 적합하게 데이터를 가공하는 작업 2. 데이터 전처리에 유용한 pandas 명령어 - 원본 데이터 ​ ​ 1. query() : 행 추출 실행 명령어 : exam.query('nclass=1') 활용 명령어 : exam.query('nclass==1 | nclass==3 | nclass==5') + 추출한 행으로 데이터 만들기 test=exam.query('nclass==1 | nclass==3 | nclass==5') test['math'].mean() ​ ​ 2. 데이터프레임명[] : 열 추출 실행 명령어 : exam[['nclass','math','english']] + 특정 변수 제거하기 exam.drop(columns = 'math') ​ ​ 3. query() + 데이..

[알고리즘] 백준 5525 파이썬 - IOIOI

5525번: IOIOI N+1개의 I와 N개의 O로 이루어져 있으면, I와 O이 교대로 나오는 문자열을 PN이라고 한다. P1 IOI P2 IOIOI P3 IOIOIOI PN IOIOI...OI (O가 N개) I와 O로만 이루어진 문자열 S와 정수 N이 주어졌을 때, S안에 PN이 몇 www.acmicpc.net 문제 N+1개의 I와 N개의 O로 이루어져 있으면, I와 O이 교대로 나오는 문자열을 PN이라고 한다. P1 IOI P2 IOIOI P3 IOIOIOI PN IOIOI...OI (O가 N개) I와 O로만 이루어진 문자열 S와 정수 N이 주어졌을 때, S안에 PN이 몇 군데 포함되어 있는지 구하는 프로그램을 작성하시오. 문제풀이 n=int(input()) m=int(input()) s=input(..

카카오뷰 창작센터(친구추가 및 맞추)

1. 카카오 뷰 수익 조건 카카오 뷰는 카카오톡 채널 친구수 100명 이상과 발행한 보드 수가 10건 이상일 때 부터 수익을 받을 수 있다. 기본적으로 발행 보드 수 10건은 쉽지만 채널 친구수 100명이 굉장히 어렵다. 그렇기에 보통 "선추 후 맞추"라는 개념이 있다. 네이버의 서이추와 비슷하면서 살짝 다른 개념이다. 2. 카카오 뷰 연결? 이렇게 티스토리, 유튜브, 인스타그램과 연동할 수 있다. 나는 네이버, 티스토리를 운영 중이기에 카카오 뷰도 채널을 개설하였다. 하루에 총 10개의 보드를 올릴 수 있게 제한되어있다. 현재 나는 티스토리에 약 200개 정도를 포스팅했기에 카카오 뷰에 작성하는데 약 20일 정도 소모했던 것 같다. ​ 위 3개 중 하나를 운영한다면 플러스 알파로 운영하는 것이 좋다고 ..

일상 2023.01.09

[알고리즘] 백준 1564 파이썬 - 팩토리얼5

1564번: 팩토리얼5 첫째 줄에 정수 N이 주어진다. N은 1,000,000보다 작거나 같다. 또, 9보다 크거나 같다. www.acmicpc.net 문제 팩토리얼5란, N!의 0이 아닌 뒤 5자리를 말한다. N이 주어졌을 때, 팩토리얼5를 구하는 프로그램을 작성하시오. 문제풀이 n=int(input()) x=1 for i in range(2,n+1): #01 x*=i while True: #02 if str(x)[-1]=="0": x//=10 else: break #03 x%=10**30 print(str(x)[-5:]) - #01 : x에 팩토리얼과 같이 누적으로 n+1까지 곱해준다. - #02 : 곱하는 과정에서 x의 맨 뒷자리가 0이라면 x를 10으로 나눈 몫을 x에 저장한다. - #03 : 너..

[Python] 데이터 분석 기초(pandas, numpy, 파생변수)

1. 기초 지식 - 데이터 프레임 : 행과 열로 구성된 사각형 모양의 표 - 열 ​: 컬럼 또는 변수라고 부른다. (가로) - 행 : 로 또는 케이스라고 부른다. (세로) ​ 행이 반드시 사람이어야 하는 건 아니다. 하나의 단위가 하나의 행이 된다. 데이터가 크다는 뜻은 행이 많다 또는 열이 많다 라는 뜻이다. ​ 행이 많다 -> 컴퓨터가 느려짐 -> 고사양 장비 구축 열이 많다 -> 분석 방법의 한계 -> 고급 분석 방법 빅데이터 보다는 다양한 변수가 담겨 있는 다양한 데이터가 더 중요하다. 2. pandas 및 데이터프레임 기초 - head() : 앞부분 출력(기본 5) - tail() : 뒷부분 출력(기본 5) - shape : 행, 열 개수 출력 - info() : 변수 속성 출력 - descri..

[알고리즘] 백준 9251 파이썬 - LCS

9251번: LCS LCS(Longest Common Subsequence, 최장 공통 부분 수열)문제는 두 수열이 주어졌을 때, 모두의 부분 수열이 되는 수열 중 가장 긴 것을 찾는 문제이다. 예를 들어, ACAYKP와 CAPCAK의 LCS는 ACAK가 된다. www.acmicpc.net 문제 LCS(Longest Common Subsequence, 최장 공통 부분 수열)문제는 두 수열이 주어졌을 때, 모두의 부분 수열이 되는 수열 중 가장 긴 것을 찾는 문제이다. 예를 들어, ACAYKP와 CAPCAK의 LCS는 ACAK가 된다. 문제풀이 a=input() b=input() ans=[0]*1000 #01 for i in range(len(a)): tmp=0 for j in range(len(b)): ..

[Python] 아나콘다 설치 및 파이썬, JupyterLab 이용하기

1.아나콘다란? 패키지 관리와 디플로이를 단순하게 할 목적으로 과학계산을 위한 파이썬과 R 프로그래밍 언어의 자유-오픈 소스 배포판이다. 2. 아나콘다 설치하기 Anaconda | Anaconda Distribution Anaconda's open-source Distribution is the easiest way to perform Python/R data science and machine learning on a single machine. www.anaconda.com 해당 링크에 들어가서 각각 체계에 맞게 설치하면 된다. 이후 next->I agree-> Install 순으로 설치 후 마지막 Finish 과정에서 체크를 모두 해제하고 Finish 버튼을 누르면 된다. 3. JupyterLab ..

[알고리즘] 백준 12865 파이썬 - 평범한 배낭

12865번: 평범한 배낭 첫 줄에 물품의 수 N(1 ≤ N ≤ 100)과 준서가 버틸 수 있는 무게 K(1 ≤ K ≤ 100,000)가 주어진다. 두 번째 줄부터 N개의 줄에 거쳐 각 물건의 무게 W(1 ≤ W ≤ 100,000)와 해당 물건의 가치 V(0 ≤ V ≤ 1,000) www.acmicpc.net 문제 이 문제는 아주 평범한 배낭에 관한 문제이다. 한 달 후면 국가의 부름을 받게 되는 준서는 여행을 가려고 한다. 세상과의 단절을 슬퍼하며 최대한 즐기기 위한 여행이기 때문에, 가지고 다닐 배낭 또한 최대한 가치 있게 싸려고 한다. 준서가 여행에 필요하다고 생각하는 N개의 물건이 있다. 각 물건은 무게 W와 가치 V를 가지는데, 해당 물건을 배낭에 넣어서 가면 준서가 V만큼 즐길 수 있다. 아직..