efficiency (12) 썸네일형 리스트형 [Python] Matplotlib으로 데이터 시각화 1. 파이 차트 - data visualization, pie chart, seaborn color palette, 파이 차트 그리기 데이터를 다루는 일을 하다보면, 그래프를 그리는게 큰 흐름을 읽는데 도움이 될 때가 많더라구요.많은 정보를 직관적으로 이해하기 위해서 그래프 그리는 일의 중요성을 느낍니다. 오늘부터 시리즈로 Python Matplotlib 을 이용해서 그래프 그리는 방법을 포스팅해보려고 합니다. 저는 금융 데이터를 분석하는 일을 자주 하는데, 제가 일하면서 가장 자주 쓰는 그래프는 이렇게 네가지 입니다. 1. 파이차트 : 업권, 기업의 수익이나 비용 구조 파악2. 선 그래프: 경제 변수의 트렌드나 변화를 파악3. 산점도 (Scatter plot): 변수간 관계 파악4. 박스 플롯(box plot) 또는 히스토그램: 변수의 분포 파악 이 네가지를 시리즈로 다루어보려고 하구요, 오늘은 그중에 파이 차트부터 시작하겠습니.. [Python] 파이썬을 이용한 패널 데이터 분석 3 - 정규표현식, regex로 데이터 프레임에서 원하는 칼럼과 행 추출하기, pandas, df.filter(), 파이썬과 STATA, 파이썬과 엑셀 파이썬을 이용한 패널데이터 분석 3번째 포스팅입니다. 지금까지의 파이썬 포스팅은 여기에: https://log-maynard.tistory.com/9 [Python] 파이썬을 이용한 패널 데이터 분석 - Pandas dataframe에서 전기항(전기값) 변수 만들기, lag oper패널 데이터 분석(혹은 시계열 데이터 분석)을 하다보면 변수의 전기값을 값으로 갖는 변수를 만들어야 할 때가 있습니다. 예를들면, 성장률(증가율)을 계산하려면 전기항을 불러와서 이번기값/log-maynard.tistory.comhttps://log-maynard.tistory.com/16 [Python] STATA와 Python 비교. STATA에서 Python으로 옮겨가기: 기본기능 비교 - Part1요즘 Python이 워낙.. [Python] 파이썬을 이용한 패널 데이터 분석 2 - 여러 데이터 셋 합치기, 판다스 pd.merge와 pd.concat, 파이썬과 엑셀 vlookup, pd.wide_to_long, df.sort_values() 연구를 할때 데이터를 여러 소스에서 가져오는 경우가 많죠. 예를 들면 국가별 주가지수 수익률과 GDP성장률의 관계를 살펴보는 연구를 한다면 주가지수는 야후 finance에서, GDP는 World bank에서 가져올 수 있겠죠. 그럴때 두개의 데이터셋을 하나의 데이터셋으로 합치는 작업이 필요합니다. 오늘은 두 데이터셋을 합치는 데 쓸수있는 함수 merge와 concat에 대해서 다루어 보겠습니다. 판다스 라이브러리를 사용하겠습니다. 0. 데이터 준비 import pandas as pdimport pandas as pd 로 판다스를 불러오면서 시작할게요. (판다스 설치가 안되어있다면 pip install pandas 를 이용해서 설치해 주세요.) 예시로 데이터셋 두개를 만들어볼건데요, 첫번째 데이터.. [Python] STATA와 Python 비교. STATA에서 Python으로 옮겨가기: 기본기능 비교 - Part1 요즘 Python이 워낙 많이 쓰이다 보니 STATA나 SAS, R 등을 쓰다가도 Python으로 옮겨가는 분들이 많은 것 같습니다. Python은 범용언어이기 때문에 유연하게 여러가지 목적으로 사용하기에 아주 좋습니다. 오늘은 STATA에서 Python으로 옮겨가는 분들, 혹은 Python을 다루지만 STATA도 좀 알고싶은 분들을 위해서 둘을 비교해보려고 합니다. 특히 이번 포스팅에서는 Python Pandas 라이브러리 위주로 STATA와 비교해보겠습니다. STATA의 데이터 셋과 판다스의 데이터 프레임을 대응시킬 수 있기 때문입니다. 내용이 좀 길것 같아서 포스팅을 여러 파트로 나누어서 다루려고 합니다. 오늘 다룰 내용은 아래와 같습니다.: 1. import 2. 변수 rename 3.. 구글맵 (Google map)으로 여행 지도 만들기- 구글맵 사용법, 공유 방법 여행을 갈 때 제게 가장 유용한 앱은 구글맵인 것 같습니다. 얼마전 대만 가오슝을 방문했을 때도 구글맵을 아주 유용하게 사용했는데요, 관련해서 구글 맵 사용법을 간단히 정리해보았습니다. 먼저 제가 생각하는 구글맵의 장점은 이렇습니다: 1. 여러 장소의 상대적 위치 확인이 간편하다. 2. 지도를 친구들과 공유가 쉽다. 3. 맛집이나 박물관 리뷰 및 이용 시간 확인이 쉽다. 4. 장소간 이동 수단 및 경로 확인이 쉽다.(예를 들면, 어디까지 걸어가서 몇 번 버스를 타라던가…) 1. 지도 만들기 먼저 지도 만드는 방법입니다: 구글맵> 저장됨> +새목록 구글맵 앱을 열고 맨 아래 가운데에 있는 “저장됨” 표시를 누릅니다. 화면이 넘어가면 나오는 “+ 새 목록”을 클릭합니다. 다음으로는 새 목록 제목을 만들어주면.. 속독 방법 (Speed reading) - 독서, 팀 페리스, 빠르게 읽는 법, 멜버른 여행 도서관 추천 읽어야 할 문서는 많고 시간은 없을 때 (문헌 연구를 할 때 라던가...) 속독을 하면 좋겠다,는 생각을 많이 했었습니다. 자기 개발서를 읽을 때도 그런 경우가 많구요. 내용은 이미 파악이 됐고 예시 같은 추가적인 설명은 딱히 필요 없어 보여서 건너뛰고 싶을 때 있잖아요? 그래서 최근에 속독에 대해서 좀 찾아보았습니다. 유튜브나 구글에서 검색을 해보았는데, 개인적으로 가장 도움이 된 영상을 하나 소개하면서 속독 방법에 대한 포스팅을 작성해보려고 합니다. 도움을 받은 영상은 팀 페리스의 아래 영상입니다. '타이탄의 도구들' 저자로 유명한 팀 페리스의 영상으로 유튜브에서 찾았습니다 . https://youtu.be/ZwEquW_Yij0?si=eJ0EzPTLOgp6H2Zi 이 영상에 나와있는 속독법을 제 방식.. [Python] 파이썬을 이용한 패널 데이터 분석 - Pandas dataframe에서 전기항(전기값) 변수 만들기, lag operator, shift, pct_change 패널 데이터 분석(혹은 시계열 데이터 분석)을 하다보면 변수의 전기값을 값으로 갖는 변수를 만들어야 할 때가 있습니다. 예를들면, 성장률(증가율)을 계산하려면 전기항을 불러와서 이번기값/전기값-1= 증가율로 계산해줘야 합니다. 이번에는 판다스(pandas) library를 사용해서 데이터를 분석하는 세팅에서, 전기항 만드는 방법에 대해서 포스팅하려고 합니다. 구체적으로는 다음과 같은 것들에 대해서 다뤄보겠습니다: 0. (준비단계) 데이터 프레임 만들기 1. shift() 2. (응용) lag operator 만들기 3. (참고) pct_change 0. (준비단계) 데이터 프레임 만들기 먼저 아래 코드를 이용해서 주가 데이터를 데이터프레임에 입력해주겠습니다. pandas와 numpy 라이브러리를 불러와 .. 한글 (HWP) 문서 작성 기본기 - 엑셀 표 한글에 붙여넣기, 자간 줄이기, 단축키 평소 MS Word나 Latex으로 문서 작업을 하더라도 간혹 한글을 사용해야 하는 경우가 생깁니다. 정부 관련 기관들은 한글을 많이 사용하는 것 같아요. 한글과 MS Word의 UI가 비슷하기 때문에 글을 쓰는건 그닥 어렵지 않지만, 간혹 양식을 맞추다보면 사소한 부분이 틀어져서 시간이 낭비될 때가 있습니다. 시간 낭비를 줄이기 위해서 유용하게 사용할 수 있는 한글 기본기를 정리해 보려고 합니다. Part 1. 엑셀(MS Excel)에서 만든 표 붙여넣기 표를 만들거나 그래프를 그리는 작업은 엑셀에서 하고, 한글에는 결과물만 붙여넣는 경우가 많습니다. 표를 붙여 넣을 때 주로 두가지 방법을 사용하게 되는데요, 1) 엑셀과 연결하여 붙여넣는 방법과 2) 한글 파일에서 표를 만든 후 표의 내용만 엑셀에서 .. 이전 1 2 다음