Pandas | 특정 칼럼의 특정값의 row 제거 & 중복되는 값 row 제거

Dev/Python

sooya14 2020. 4. 21. 18:03

| 특정값의 row 제거하기

df

  a b c d e 
0 1 3 5 7 8
1 3 0 4 6 6
2 3 0 3 3 9
3 9 9 7 8 4

위의 데이터프레임에서 'b'의 값이 0인 row 를 제거하여 데이터프레임을 구성하고 싶다고 가정할게요

즉,

인덱스가 1, 2 인 row를 제거하고 싶을 때,

df = df[df.b != 0]
df.tail()

결과는 이렇게,

짜란~

df

  a b c d e 
0 1 3 5 7 8
1 9 9 7 8 4

다시 이 데이터 프레임을 사용하고

df

  a b c d e 
0 1 3 5 7 8
1 3 0 3 6 6
2 3 0 5 3 9
3 9 9 7 8 4

위의 데이터프레임에서 'a' 값이 중복되는 경우 한가지의 row 만 가져오고 싶을 때,

즉

인덱스 1, 2 의 row 는 a 의 값이 동일하다 이럴 때 둘 중 하나의 row 만 구성하고 싶을 때

res = df.drop_duplicates("a", keep="first")

keep="first"

중복되는 값의 첫번째 row를 가져오고 나머지는 버리기

keep="last"

중복되는 값 중에 가장 마지막 row를 가져오기

아래가 그 결과

df

  a b c d e 
0 1 3 5 7 8
1 3 0 3 6 6
2 9 9 7 8 4

PyCharm (파이썬 IDE) 윈도우에 설치하기 (0)	2020.07.02
Pandas \| Dataframe 평균 계산하기 (0)	2020.05.03
Pandas \| DataFrame - merge 병합 하기 & concat 결합 하기 (0)	2020.04.20
Python \| BeautifulSoup4 사용해서 웹 크롤링 + CSV 로 만들기 (0)	2020.04.09
Python \| 데이터 시각화 - folium 라이브러리로 지도 그리기 (0)	2020.03.26

sooblogya

python #pandas, dummydata, git, data, pandas, JSON, Python, 브스코, JavaScript, 파이썬, react #리액트 #hooks #리액트훅 #자바스크립트 #노마드코더, pandas # merge # python, git #git에러 #github,