map(), apply(), applymap() 함수 map() : Series에서만 사용가능 apply() : Series, DataFrame 둘 다 사용 가능 applymap() : DataFrame에서만 사용 가능 apply() 함수도바 빠름 map() 함수

apply() 함수

  Series.str string 관련 함수를 모두 사용할 수 있음 Series.str.get() 함수

 

누락 데이터 확인 df.info() df.value_counts(dropna=False) df.isnull() df.notnull() df.isnull().sum(axis=0) df[‘deck’].value_counts(dropna=False) df[‘deck’].isnull() df[‘deck’].notnull() df[‘deck’].isnull().sum() 누락 데이터 제거 df.dropna() df.dropna(axis=0) df.dropna(axis=1) df.dropna(axis=1, thresh=750) df.dropna(how=’any’) df.dropna(how=’any’, axis=1) df.dropna(how=’all’) df[‘age’].dropna() df.dropna(subset=’age’) df[[‘age’,’deck’]].dropna() df[[‘age’,’deck’]].dropna(how=’all’) df.dropna(subset=[‘age’,’deck’]) df.dropna(subset=[‘age’,’deck’], how=’all’) df.dropna(subset=[‘age’,’deck’], how=’all’, ignore_index=True) df.dropna(subset=[‘age’,’deck’], how=’all’, inplace=True) 누락 데이터 치환 df.fillna(100, inplace=True) df[‘age’].fillna(100, inplace=True) m = df[‘age’].mean(axis=0) df[‘age’].fillna(m, inplace=True) m… Continue Reading Part 5. 데이터 사전 처리

Matplotlib 그래프 그리기  기초 titanic 데이터 불러오기

그래프 1

그래프 2

그래프 3

그래프 4

그래프 5

그래프 6

그래프 7

그래프 8

그래프 9

그래프 10

그래프 11

그래프 12

그래프 13

그래프 14

Continue Reading Part 4. 시각화 도구

데이터 일부 보기 df.head(n) : 앞부분 미리 보기 df.tail(n) : 뒷부분 미리 보기 데이터 요약 정보 확인 df.shape df.dtypes / df[열이름].dtypes df.info() df.describe() 데이터 개수 확인 df.count() : 각 열의 데이터 개수를 Series 형으로 반환 df[‘열이름’].value_counts() : 열의 고유값의 개수 통계함수 df.mean() / df[‘열이름’].mean() : 평균 df.median() / df[‘열이름’].median() :… Continue Reading Part 3. 데이터 살펴보기

외부 파일 읽어오기 CSV : read_csv(), to_csv() JSON : read_json(), to_json() HTML : read_html(), to_html() Local Clipboard : read_clipboard(), to_clipboard() MS Excel : read_excel(), to_excel() HDF5 Format : read_hdf(), to_hdf() SQL : read_sql(), to_sql() pd.read_csv() 매개변수들 path : 파일 위치 sep or delimiter : 구분 문자 header : 열이름(기본 0),… Continue Reading Part 2. 데이터 입출력

판다스 자료구조 Series Series의 구조 Series 만들기 : pd.Series() 인덱스 구조 : sr.index,  sr.values 원소 선택 : sr[‘c’],  sr[1] DataFrame DataFrame의 구조 DataFrame 만들기 : pd.DataFrame() 행이름, 열이름 지정 : pd.DataFrame(2차원배열, index=??, columns=??) 행 인덱스 변경 : df.index = [] 열 이름 변경 : df.columns = [] 행 인덱스 일부… Continue Reading Part 1. 판다스 입문

error: Content is protected !!