Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- pandas
- RNN
- 밑바닥부터 시작하는 딥러닝
- 신경망 학습
- 역행렬
- SVD
- 동시발생 행렬
- ReLU
- NMT
- Linear Algebra
- PPMI
- machine translation
- 밑바닥부터 시작하는 딥러닝2 2장
- 판다스
- word embedding
- NLP
- 자연어처리
- word2vec
- Python
- 정칙행렬
- 데이터프레임
- 벡터간 유사도
- 딥러닝
- Transformer
- one-hot vector
- 연립일차방정식
- sigmoid
- 프로그래머를 위한 선형대수
- DataFrame
- 선형대수학
Archives
- Today
- Total
생각하는감자
Pandas, Dataframe, Series 본문
자연어처리를 배운 이후 프로젝트를 수행하면서 데이터처리에 대한 아쉬움을 스스로 많이 느끼게 되어 시작하게 된 판다스!
유튜브 무료강의를 보면서 차근차근 정리하고 실습해볼 예정이다.
팬더스
팬더스는 파이썬 라이브러리로, 데이터를 수정하고 목적에 맞게 수정하는 데에 유용하게 쓰이며, 주로 아래와 같이 작성하고 사용한다.
import pandas as pd
pandas 라는 라이브러리를 가져오고 이를 pd라는 별칭으로 사용하겠다는 의미이다.
데이터프레임
dataframe 은 엑셀과 유사한데 2d frame 이라고 생각하면 된다. 엑셀을 사용하지 않고 팬더스를 사용하는 이유는, 프로그래밍을 할 수 있고 팬더스에는 numpy 가 있기 때문에 연산의 속도가 빠르기 때문이다.
데이터프레임을 만들어보자면,
data_frame = pd.read_csv('파일경로/파일명.csv')
위와 같은 형식으로 정의할 수 있다. 팬더스 함수 중 csv 파일을 읽어와서 데이터 프레임형식으로 변환해주는 코드이다.
데이터프레임에서 column을 시리즈라고 한다. 즉, series 로 구성된 것이 dataframe이라고 할 수 있다.
dataframe = series의 결합체
시리즈
series 는 파이썬 list를 사용하여 만드는데, 파라미터로 list를 넣어주면 된다.
series_01 = pd.core.series.Series(['a','b','c'])
series_02 = pd.core.series.Series([1,2,3])
위에 정의된 series를 가지고 데이터 프레임을 만들기 위해서는 아래와같은 코드를 사용하면 된다.
pd.Dataframe(data=dict(word = series_01, num = series_02))
'Pandas' 카테고리의 다른 글
Dataframe (5) (0) | 2023.03.18 |
---|---|
Dataframe (4) (0) | 2023.03.17 |
Dataframe (3) (0) | 2023.03.17 |
Dataframe(2) (0) | 2023.03.11 |
Dataframe(1) (2) | 2023.03.10 |