본문 바로가기

반응형

Programming Language/Data & A.I. (데이터 & 인공지능 관련)

[ 판다스(Pandas) ] 데이터 프레임에 새로운 데이터 추가하기, 로우 인덱스/ 컬럼 인덱스 이름 바꾸기(rename : 리네임) 판다스 기존 데이터에 새로운 데이터를 추가하고 싶다면, 기존 컬럼(열) 크기에 맞게 데이터를 입력해준 후 맨 밑 부분을 len(df) 를 이용하여 넣어주는 방식으로 진행됩니다. 또한 rename 속성은 로우 컬럼 인덱스 이름 교체하기 위해서 사용됩니다. 예시로 한번 살펴보겠습니다. Q . '무한도전' 데이터에서 새로운 데이터인 '황광희' 데이터를 추가해주세요 우리가 이 글에서 할 문제입니다. 0. 기존의 무한도전 데이터를 불러오세요 #판다스 불러오기 import pandas as pd #데이터 불러오기(인덱스 기본 번호 지정 x) challenge_df = pd.read_csv('무한도전.csv',encoding = 'cp949', index_col = 0) challenge_df 저는 기존에 있는 '무.. 더보기
판다스 데이터프레임 '부분 / 행 전체 / 열 전체'를 수정하려면 어떤 코드를 써야 하나요?? 판다스 데이터프레임을 수정하는 방법은 일부(부분)를 수정하는 것과 열 또는 행 전체를 바꾸는 방법으로 나누어지며, 그 원리는 유사하다고 볼 수 있습니다. 즉, 데이터프레임의 위치를 loc를 통해서 지정해주어 바꾸는 방식으로 둘 다 진행됩니다. 밑에 예시로 살펴 보시죠 :) 1. 데이터프레임 일부분 수정하기 a. 행 또는 열 이름을 작성해주어 수정해주는 경우 #해당 위치의 행 / 열 이름을 아는 경우 df.loc['행 이름', '열 이름'] = '수정 후 데이터' # 예시 ) '지역명', '위치' 위 데이터의 '서울' 데이터를 '수원'으로 바꾸어주어야하는 경우 df.loc['지역명', '위치'] = '수원' 예시를 보면 아시겠지만, 일부 데이터프레임만 데이터 값을 바꾸고 싶은 경우 이렇게 바꾸어주면 됩니다.. 더보기
오래 보기엔 밝아서 눈이 아픈 기본 주피터 노트북 테마 ( 스킨 )를 바꿔보겠습니다. [jupyter notebook themes] 안녕하세요 오늘 포스팅은 주피터 노트북 테마 변경에 관련해서 확인해보겠습니다. 기본 주피터 노트북의 경우 흰바탕이어서 다소 눈이 아픈 편인데요 ! 저만 그런지는 몰라도 오래 코딩을 하고 있으면 눈이 조금 시큰거리는 느낌을 많이 받게 되더라구요 ! 그래서 주피터 노트북 스킨을 한번 바꾸어봤습니다. 쥬피터 노트북의 경우 여러가지 테마( 스킨 ) 들을 비교해가면서 적용이 가능합니다. 밑의 예시들에서 다 한번씩 확인해보시고 가장 마음에 드는 것을 적용해보세요 :) 0. 시작하기 전에 ! 아나콘다를 아직 미설치 하신 경우 Anaconda Prompt 가 없는 경우 파이썬과 아나콘다를 따로 설치해주어야 합니다 ! 'anaconda download' 만 쳐도 제일 상단에 아나콘다 공식 홈페이지에서 다운로드 받는 곳이.. 더보기
서로 붙어있지 않는 행, 열을 따로 추출 & 다른 변수에 저장해주려면??? [판다스(pandas) 데이터프레임 파이썬] 이번에는 데이터 인덱싱 중 특정 열 부터 특정 행 까지 출력하는 방법에 대해서 알아보겠습니다. 사실 인덱싱을 여러 군데에서 하게되면 그 정보를 담는 데이터를 또 다른 변수에 지정하기도 하고, 원래 데이터를 변형하기도 하는데요. 이따가 예시도 적겠지만, 그러한 경우에 내가 필요한 정보를 남겨두고 , 혹은 따로 빼두고 남은 데이터 부분을 변형하는 경우가 많습니다. 그렇기에 데이터 프레임에 부분에 대한 인덱싱이 매우 !! 중요하다고 생각합니다. 이거 이전에 포스팅 한 글을 보셨다면 '이거 왠지 여기서부터 여기까지 이렇게 코딩하면 되지 않을까' 생각이 드실 수도 있습니다. 한 줄 정도 시리즈 단위로는 물론 그 방법으로 인덱싱 해주어도 되지만, 그렇게 말고 지금 이 글에서는 다수의 시리즈를 지정하여 복사 혹은 분.. 더보기
판다스(Pandas) 데이터 프레임 행/열 따로 불러오기(인덱싱) 및 시리즈(Series)에 대한 이해 오늘은 판다스(Pandas)에서 데이터 프레임 안에 정보 들을 파악하고, 그 정보 들의 위치에 따른 값을 확인하는 방법을 알아보도록 하겠습니다. 1. pandas를 import 하고 데이터 프레임 불러오기 실행 코드 공유 import pandas as pd #데이터 불러오기(인덱스 기본 번호 지정 x) challenge_df = pd.read_csv('무한도전.csv',encoding = 'cp949', index_col = 0) challenge_df 이렇게 두개의 코드를 불러와줬고, 판다스 데이터프레임으로 csv 파일을 불러온 뒤 challenge_df 변수에 그 값을 저장해주었습니다. 이 csv 파일의 경우 그냥 불러올 경우 에러코드가 나올 수 있으므로 encoding을 'cp949'로 지정해주어 .. 더보기
판다스(Pandas) 엑셀 파일 & csv파일 불러오기 및 에러코드(UnicodeDecodeError) 오늘은 판다스에서 엑셀 형식(xlsx) 데이터 프레임을 불러오고, 그 데이터 프레임을 편집하는 방법을 포스팅 해보도록 하겠습니다. 1. pandas를 import 하기 import pandas as pd 아마 이 글을 찾아보시는 대부분은 이 import 하는 순서를 지나치시겠지만, 초심자 분이 혹시라도 있다면 이 import pandas 부분을 뺴먹으시면 안 됩니다. 우리가 사용하는 데이터프레임 라이브러리인 이 판다스는 데이터 편집을 원활하게 해주고, 파이썬 언어로 그것을 편집하기 용이하게 해주는 장점이 있습니다. 그렇기에 이 판다스를 임포트 해주는 부분을 필수적으로 진행 해주셔야 합니다. 2. 판다스 데이터 프레임 불러오기 (xlsx 형식 : 엑셀) 제가 오늘 예제 파일로 사용할 엑셀 파일입니다. 혹시.. 더보기
넘파이(Numpy) 인덱스 번호 불러오기(인덱싱:indexing)과 자르기(슬라이싱:slicing) 오늘은 넘파이(Numpy) 인덱스 번호를 통해서 배열(array) 구성요소를 변형을 해보겠습니다. 넘파이를 자유자재로 이용할 수 있기 위해서는 이 인덱스 번호에 대한 이해가 특히 중요합니다. 우선 세개의 임의의 배열(array)을 만들어 보겠습니다. 1. 넘파이(numpy) 불러오기 작성 코드 공유 # 넘파이 불러오기 import numpy as np 그 전에 가장 먼저 해주어야 하는 코드가 바로 이 넘파이를 import 하는 것입니다. numpy는 파이썬에서 바로 사용할 수 없기에, 사용하기 전에 이렇게 불러오는 코드를 먼저 작성해주어야 사용이 가능합니다. numpy library를 이렇게 불러오고 난 뒤에는 우리가 원하는 배열(array)과 그 구성요소를 지정해주어야 합니다. 2. 예시 배열(arra.. 더보기
pandas 데이터 전처리 시각화 ylim, 한 그래프에 같이 그리기: 감기/독감/코로나 검색과 코로나 검사량에는 상관관계가 있을까 ? (상관관계 데이터 시각화) - [캐글 코로나 데이터 셋/ Kaggle coronaviru.. collocationvoca.tistory.com/7 '누적 확진자' 수 데이터에서 '일별 확진자 수'로 데이터 편집 (캐글 코로나 데이터 셋/ Kaggle corona www.kaggle.com/kimjihoo/coronavirusdataset 데이터 셋을 받을 수 있는 캐글 사이트. 2020년 코로나 south korea 데이터를 이용하여 연습을 해봤다. 데이터는 11개의 칼럼으로 이루어져있고 다음과 같았다. 일.. collocationvoca.tistory.com 위 블로그 글은 일별 확진자 수 데이터 편집 방법이었습니다. 이제 저 일별 확진자수 데이터를 바탕으로 다른 데이터와의 연관관계를 보고싶었습니다. 그러던 와중에 눈에 들어왔던게 Search Trend 데이터였습니다. 문득, 연관 검색량과 코.. 더보기

반응형