본문 바로가기
2/[ Machine Learning ]

How do I read a tabular data file into pandas?

by Kieran_Han 2020. 11. 26.

Source: youtu.be/5_QXMwezPJE

 

import pandas as pd

#pd.read_table('파일경로')

pd.read_table('http://bit.ly/chiporders')

orders = pd.read_table('http://bit.ly/chiporders')

orders.head()

pd.read_table('http://bit.ly/movieusers')

# '|'로 구분되어 있으므로 Column을 나눠줌

pd.read_table('http://bit.ly/movieusers', sep='|')

#1st row를 Header로 인식하므로 Header를 추가해줌

pd.read_table('http://bit.ly/movieusers', sep='|', header=None)

user_cols = ['user_id', 'age', 'gender', 'occupation', 'zip_code']

users = pd.read_table('http://bit.ly/movieusers', sep='|', header=None, names=user_cols)

users.head()

 

skiprows = [1, 2, 3, ...] or skiprows=range(A, B)사용하여 입력한 행을 제외한 나머지 행 출력

pd.readtable('http://bit.ly/movieusers', sep='|', header=None, names=user_cols, skiprows=range(A, B))

 

skipfooter=n을 사용하여 뒤에서 n개를 제외한 나머지 행 출력

pd.readtable('http://bit.ly/movieusers', sep='|', header=None, names=user_cols, skiprows=range(A, B), skipfooter=n)

' > [ Machine Learning ]' 카테고리의 다른 글

MNIST  (0) 2020.12.03
Overfitting  (0) 2020.12.02
Machine Learning System의 종류  (0) 2020.12.02
Why do some pandas commands end with parentheses, and others don't?  (0) 2020.11.26
How do I select a pandas Series from a DataFrame  (0) 2020.11.26