본문 바로가기

python4

[python] 데이터프레임,list 파일로 저장하는법 1. 데이터프레임저장 pkl로 저장 객체를 직렬화라여 저장하는 파일 형식 데이터를 저장하고 다시 불러올때 데이터 형식을 변환하지 않아도 되기 때문에 빠른 속도로 불러올 수 있음. 저장하고자하는 데이터의 크기가 크지 않을 경우에 사용 # 저장 df.to_pickle('test2.pkl') # 불러오기 df2 = pd.read_pickle('test2.pkl') csv로 저장 데이터를 쉼표(,)로 구분하여 저장하는 형식 다른 프로그램에서도 사용할 수 있도록 공유할 경우에 사용 데이터의 크기가 클때 사용 # 저장 df.to_csv("houseprice.csv", index = False) # index = 인덱스를 컬럼에 추가안한다면 False # 불러오기 df = pd.read_csv('houseprice... 2023. 4. 18.
[pandas] 데이터 프레임 모든 행,열 출력하기 alphabet = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z'] num = range(300) df = pd.DataFrame({i:num for i in alphabet}) df 위 코드를 실행 시켜보면 위처럼 가운데가 생략되는데, 이때 # 방법1 pd.options.display.max_rows = None # 모든 행 출력 pd.options.display.max_columns = None # 모든 열 출력 # 방법2 pd.set_option('display.max_rows', None) # 모든 행 출력 pd... 2023. 4. 16.
[python] 전처리 1. NAN값에 대하여 1. 평균값으로 채우기 # Age 평균 구하기 mean_age = titanic['Age'].mean() # NaN을 평균값으로 채우기 titanic['Age'].fillna(mean_age, inplace=True) 2. 앞/뒤로 채우기 시계열 데이터에서 많이 사용하는 방법 ffill : 앞의 값으로 채우기 bfill : 뒤의 값으로 채우기 # Ozone 변수 NaN 값을 바로 앞의 값으로 채우기 air['Ozone'].fillna(method='ffill', inplace=True) # Solar.R 변수 NaN 값을 바로 뒤의 값으로 채우기 air['Solar.R'].fillna(method='bfill', inplace=True) 3. 선형 보간법으로 채우기 # 선형 보간법.. 2023. 3. 10.
[python] 파이썬 팁 글씨 선명하게 출력 %config InlineBackend.figure_format='retina' 경고제거 import warnings warnings.filterwarnings('ignore') 데이터프레임 모든 열 보기 # 모든 열 보기 pd.set_option('display.max_columns', None) # 모든 행 보기 pd.set_option('display_max_rows',None) plt 한글이 깨질때 !sudo apt-get install -y fonts-nanum !sudo fc-cache -fv !rm ~/.cache/matplotlib -rf # 런타임 다시시작 import matplotlib.pyplot as plt plt.rc('font', family='NanumBar.. 2023. 3. 7.