본문 바로가기

둘/[ Python ]51

Kernel(커널) 수식에 n차원 행렬이 있을 경우 단순하게 처리하고자할 때 사용하는 방법 Z.β) 수식에 n차원 행렬이 있을경우, (1 x n) (n x 1)로 만들어서 쉽게 수식을 해결하는 방법을 Kernel이라고 한다. 2020. 12. 21.
matplotlib Graph 2020. 12. 8.
%matplotlib inline # 주피터 노트북의 매직 명령 hist() Method는 matplotlib을 사용하고 결국 화면에 그래프를 그리기 위해 사용자 컴퓨터의 그래픽 백엔드를 필요로 한다. 그래서 그래프를 그리기 전에 matplotlib이 사용할 백엔드를 지정해줘야 한다. 주피터의 매직 명령 %matplotlib inline을 사용하면 편리하다. 이 명령은 matplotlib이 주피터 자체의 백엔드를 사용하도록 설정한다. 그러면 그래프는 노트북 안에 그려지게 된다. 주피터 노트북에서 그래프를 그릴 때 show() Method를 호출하는 것은 선택 사항이다. 주피터는 셀이 실행될 때 자동으로 그래프를 그려준다. 2020. 12. 8.
info( ) Method info( ) Method는 데이터에 대한 간략한 설명과 특히 전체 행 수, 각 특성의 데이터 타입과 null이 아닌 값의 개수를 확인하는 데 유용하다. 2020. 12. 8.
iloc, loc Function DataFrame에서 특정 행, 열을 선택하는 방법 loc: Label이나 조건 표현으로 indexing 하는 방법 - loc['A'] : A행만 선택 - loc[['A', 'B']] : A, B 행 선택 - loc[['A', 'B'], 0:5] : A, B 행과 5개 열 선택 * '1'열에 'D' 행만 indexing하고 싶은 경우 - data[data['1'] == 'D'] *조회된 D행에서 특정(예: '8') 열 조회 - data[data['1'] == 'D', '8'] iloc: 행 또는 열을 숫자로 위치를 나타내서 indexing 하는 방법 - iloc[0] : 첫번째 행만 선책 - iloc[-1] : 마지막 행만 선택 - iloc[:, 0] : 첫번째 열만 선택 - iloc[:, -1] : 마.. 2020. 12. 7.
Best Practices with Pandas Source: www.youtube.com/playlist?list=PL5-da3qGB5IBITZj_dYSFqnd_15JgqwA6 Best practices with pandas Learn how to perform a variety of data science tasks on real-world datasets using pandas. With each task, you'll learn how to avoid either a pandas pitfall o... www.youtube.com 2020. 11. 28.
Pandas - Dropna Function df.dropna( ) df에 NaN 값이 있으면 해당 row 통째로 제거 df.dropna(how='all') 모든 row가 NaN일때만 row 제거 df.dropna(axis=1) df.dropna(axis=1, how='all') default가 row이므로 axis를 column으로 변경 df.dropna(thresh=n) 각 row에서 NaN이 아닌 값이 최소 n개보다 적으면 해당 row 제거 2020. 11. 28.
Pandas - DataFrame 원하는 조건으로 조회 Excel Filter 기능처럼 원하는 조건으로 DataFrame을 조회하고 싶을 때 사용하는 방법 Case 1 movies.head() movies.genre.unique() #필터를 원하는 column 중 해당 column에 어떤 종류들이 있는 지 조회 movies[(movies.genre == 'Action') | (movies.genre == 'Drama') | (movies.genre == 'Family')] Case 2 movies[movies.genre.isin(['Action', 'Drama', 'Family'])] Case 3 movies[~movies.genre.isin(['Action', 'Drama', 'Family'])] 위 조건 'Action', 'Drama', 'Family'를.. 2020. 11. 27.
Pandas - Sample Function frac: 전체 개수의 비율(75%)만큼 random으로 추출 random_state: random 추출 재현성을 위한 번호 저장 예) 위 예시와 같이 random_state=100으로 지정하면, 일종의 고정 호출로 고정되어 같은 랜덤 숫자를 추출한다. 2020. 11. 27.
Top 25 pandas tricks Source: youtu.be/RlIiVeig3hc 2020. 11. 27.
5 new changes in pandas you need to know about Source: youtu.be/te5JrSCW-LY 2020. 11. 27.
4 new time-saving tricks in pandas Source:youtu.be/-NbY7E9hKxk Cheat Sheet: github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf pandas-dev/pandas Flexible and powerful data analysis / manipulation library for Python, providing labeled data structures similar to R data.frame objects, statistical functions, and much more - pandas-dev/pandas github.com 2020. 11. 26.
How do I use the MultiIndex in pandas? Source: youtu.be/tcRGa2soc-c 2020. 11. 26.
How do I apply a function to a pandas Series or DataFrame? Source: youtu.be/P_q0tkYqvSk 2020. 11. 26.
How do I create a pandas DataFrame from another object? Source: youtu.be/-Ov1N1_FbP8 2020. 11. 26.