| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
- 밑바닥부터 시작하는 딥러닝2 2장
- PPMI
- 프로그래머를 위한 선형대수
- SVD
- 밑바닥부터 시작하는 딥러닝
- ReLU
- NMT
- one-hot vector
- 동시발생 행렬
- machine translation
- 벡터간 유사도
- 자연어처리
- 정칙행렬
- 선형대수학
- 딥러닝
- word2vec
- Linear Algebra
- 데이터프레임
- RNN
- Python
- DataFrame
- 역행렬
- sigmoid
- 연립일차방정식
- 판다스
- Transformer
- pandas
- 신경망 학습
- NLP
- word embedding
- Today
- Total
목록DataFrame (5)
생각하는감자
데이터 그룹 만들기 먼저, 임의의 데이터프레임을 만들어보자. import pandas as pd student = [{'name': 'Serena', 'major': 'Computer Science'}, {'name': 'John', 'major': 'Computer Science'}, {'name': 'Nate', 'major': 'Economics'}, {'name': 'Jake', 'major': 'Psychology'}, {'name': 'Arial', 'major': 'Physics'}, {'name': 'James', 'major': 'Psychology'}, {'name': 'Jane', 'major': 'Economics'} ] df = pd.Datarame(student, colums =..
행, 열 선택하기/필터 하기 import pandas as pd book_list = [ ['name', ['The Call of Character', 'The Giver', 'Selfish Gene']], ['number', [2302, 1905, 2110]], ['location', ['A14-6', 'D03-8', 'J06-11']] ] df = pd.DataFrame.from_items(book_list) 위와 같은 데이터프레임을 만들었다고 가정하고, 2번째와 3번째 정보만 보고 싶으면 간단하게 df[1:3]라는 명령어를 사용하면 된다. *파이썬에선 배열의 정보를 불러올 때 첫 번째 값(예시에선 1)은 포함을 하고, :(콜론) 뒤에 오는 값(예시에선 3)은 포함하지 않는다. 여기서 주의할 점은 해..
데이터프레임 → 파일 만들어진 데이터프레임을 csv 파일로 저장하는 명령어는 간단하다. to_csv를 사용하면 된다!! 예를 들어, book_list라는 이름의 리스트를 활용하여 데이터프레임을 만들었다면, df = DataFrame(book_list) df = df[['title','number','location']] ** book_list 라는 것은 이전 게시물에서 사용했던 것을 간단히 재활용한 것이므로 더 자세한 생성내용은 Dataframe(1)에 있음** to_csv를 활용하여 파일로 저장해본다면, 아래와 같다. df.to_csv('books.csv') 해당 명령어를 수행하고 나면 book_list로 데이터프레임을 만든 코드파일이 있는 위치와 동일한 곳에 books라는 이름의 csv파일이 생성된다..
데이터프레임 생성 딕셔너리로 만들경우, 컬럼명이 입력 순서대로 지정되지 않음 변경방법 : ordered dictionary 사용 import pandas as pd from collections import OrderedDict book_ordered_dict = OrderedDict( [ ('title', ['The Call of Character', 'The Giver']), ('number', [2302, 1905]), ('location', ['A14-6', 'D03-8']) ] ) df = pd.DataFrame.from_dict(book_ordered_dict) 위와 같이 입력하여 딕셔너리를 만들고, 데이터프레임으로 생성해주면 된다. 리스트로 만드는 경우 import pandas as pd b..
자연어처리를 배운 이후 프로젝트를 수행하면서 데이터처리에 대한 아쉬움을 스스로 많이 느끼게 되어 시작하게 된 판다스! 유튜브 무료강의를 보면서 차근차근 정리하고 실습해볼 예정이다. 팬더스 팬더스는 파이썬 라이브러리로, 데이터를 수정하고 목적에 맞게 수정하는 데에 유용하게 쓰이며, 주로 아래와 같이 작성하고 사용한다. import pandas as pd pandas 라는 라이브러리를 가져오고 이를 pd라는 별칭으로 사용하겠다는 의미이다. 데이터프레임 dataframe 은 엑셀과 유사한데 2d frame 이라고 생각하면 된다. 엑셀을 사용하지 않고 팬더스를 사용하는 이유는, 프로그래밍을 할 수 있고 팬더스에는 numpy 가 있기 때문에 연산의 속도가 빠르기 때문이다. 데이터프레임을 만들어보자면, data_f..