프로그래밍-AI & 빅데이터/머신러닝(9)
-
[파이썬 머신러닝] 2. 판다스(2)- 데이터 셀렉션 및 필터링
1. [ ] 의 사용 넘파이와 달리 판다스는 괄호안에 index가 아닌 컬럼명만 기입이 가능하다 조건을 통해 데이터를 가져올수도있다 2. 인덱싱 기존의 ix[ ]는 명칭(label) 기반 인덱싱인데, 이는 가독성이 떨어져 deprecated되었다 특히 dataframe의 기본 인덱싱은 명칭기반이지만, 행의 인덱스가 integer인 경우 사용자가 혼란스럽게 된다. 따라서 위치기반 인덱싱인 iloc[ ] , loc[ ]를 사용한다 0행의 sex라는 컬럼의 데이터를 찾고 싶다고 하여도, iloc는 오직 위치만 변수로 허용한다 loc[ ] 의 경우는 label인 경우만 허용한다 따라서 본문의 예시에서는 iloc[0,4]로 데이터를 찾지만, 인덱스가 'a'와 같이 label로 표기된 경우는 loc ['a','na..
2021.01.25 -
[파이썬 머신러닝] 2. 판다스(1)- DataFrame의 변환,생성,수정,삭제,인덱스
판다스 역시 2차원 데이터를 다루며, 넘파이보다 훨씬 편함. DataFrame: 2차원 데이터를 담는 구조체, 컬럼이 여러개 Index: pk와 같은 고유 key값 Series: 2차원의 데이터를 담는 구조체, 컬럼이 1개. Series 여러개가 DataFrame을 구성한다. www.kaggle.com/ Kaggle: Your Machine Learning and Data Science Community Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals. www.kaggle.com 요기서 구함 csv파일 불러오기 객체 타입..
2021.01.13 -
[파이썬 머신러닝] 1. 머신러닝 이해 - 넘파이
걍 라이브러리 잘 쓰는거라서... 넘파이는 파이썬에서 선형대수 기반 프로그램을 만들도록 지원하는 패키지이다 루프 사용이 없어서 대량 데이터의 배열 연산 성능이 좋단다.. 거기에 잘 모르겠지만 로우레벨 언어쪽이랑 호환되는 API도 제공해준단다... 그래서 C나 C++로 작성하고 넘파이에서는 그냥 호출만 하기도 한단다.... 와닿지 않는 얘기들이라 나도 모르게 말줄임표를... 넘파이는 ndarray라는 자료형을 사용한다. 얘는 N차원의 배열 객체인데, 기존 파이썬과는 다르게 같은 종류의 데이터만 담을 수 있다 이게 나중에 어떻게 쓰일 지는 모르겠지만, 이 단원에서는 그냥 이거 쓰는거만 줄창 배웠다. 1. array 생성 np로 넘파이를 호출했다. array라는 메소드는 배열이나 튜플을 ndarray로 바꿔준..
2021.01.12