python dataframe 예제

팬더는 데이터 과학에 대 한 인기 있는 파이썬 패키지, 그리고 좋은 이유: 그것은 강력 하 게 제공 합니다., 표현 및 유연한 데이터 구조 데이터 조작 및 분석 쉽게, 다른 많은 것 들 중. DataFrame은 이러한 구조 중 하나입니다. 팬더 read_csv 함수를 사용하여 파이썬 통합 책에 파일을 로드하십시오 : 데이터 과학에서 개발하고 엑셀 기반 분석에서 파이썬, 스크립팅 및 자동화 된 분석의 세계로 이동하는 경우 매우 인기있는 데이터를 보게 될 것입니다. 관리 라이브러리, 파이썬의 „팬더”. 팬더 개발은 주요 개발자 웨스 맥키니와 함께 2008 년에 시작하고 라이브러리는 파이썬을 사용하여 데이터 분석 및 관리의 표준이되었다. 팬더 유창성은 모든 파이썬 기반 데이터 전문가, Kaggle 챌린지에 관심이있는 사람들 또는 데이터 프로세스를 자동화하고자하는 사람에게 필수적입니다. 축=0을 지정하여 „놓기” 함수를 사용하여 행을 제거할 수도 있습니다. Drop()은 숫자 인덱싱대신 „레이블”을 기반으로 행을 제거합니다. 숫자 위치/인덱스를 기반으로 행을 삭제하려면 iloc을 사용하여 아래 예제와 같이 데이터 프레임 값을 다시 할당합니다. 현재 데이터 프레임의 데이터 형식은 기본적으로 유추됩니다. 그러나 특성 dtype을 추가하고 원하는 형식을 입력하여 DataFrame을 특정 형식으로 강제 할 수도 있습니다.

이 예제에서와 마찬가지로: 출력: dropna() 사용 하 여 누락 된 값 삭제 : 데이터 프레임에서 null 값을 삭제하기 위해 dropna() 함수를 사용했습니다.이 fuction drop 행 /다른 방법으로 Null 값을 가진 데이터 집합의 열. 걱정하지 마! 이러한 경우 이 문제를 처리하기 위해 사용자 고유의 파서를 구성할 수 있습니다. 예를 들어 DateTime을 가져와 서식 문자열로 제어하는 람다 함수를 만들 수 있습니다. 여기에서 볼 수 있는 기술의 라이브 예제에 대 한이 노트북을 보려면 이러한 경우, 우리는 람다 함수 또는 런타임에 생성 되는 익명 함수와 함께 작업 되었습니다 참고. 그러나 사용자 고유의 함수를 작성할 수도 있습니다. 예를 들어 이 작업은 .isin() 메서드를 사용하여 수행되며, 이 메서드는 부울 데이터 프레임을 반환하여 전달된 값이 일치하는 위치를 나타냅니다. 팬더의 데이터 선택 방법은 매우 유연합니다. 이 사이트의 또 다른 게시물에서, 나는 팬더의 핵심 선택 방법에 대해 광범위하게 작성했습니다 – 즉 iloc 및 loc.