일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 앱개발
- Instagrame clone
- 전국국밥
- React
- Ros
- expo
- JavaScript
- coding
- 머신러닝
- 강화학습
- 카트폴
- 조코딩
- 딥러닝
- 사이드프로젝트
- selenium
- App
- FirebaseV9
- redux
- 강화학습 기초
- clone coding
- kaggle
- 리액트네이티브
- 크롤링
- pandas
- 정치인
- python
- ReactNative
- 클론코딩
- 데이터분석
- TeachagleMachine
- Today
- Total
목록pandas (20)
qcoding

## label encoding ## label encoding from sklearn.preprocessing import LabelEncoder fruits= ['사과','블루베리','바나나','귤','블루베리','바나나','바나나','사과'] # 레이블 인코더 생성 label_encoder=LabelEncoder() # 레이블 인코딩 적용 fruits_label_encoded=label_encoder.fit_transform(fruits) print(fruits_label_encoded) fruits_label_encoded.reshape(-1,1) -> 단점으로는 머신러닝에서는 숫자로 값을 판단하기 때문에 1와 2 의 관계가 1과 3의 관계보다 상관성이 높다고 판단할 수 있음. 실제로는 범주형 데..

https://github.com/youngwoos/Doit_Python/tree/main/Data GitHub - youngwoos/Doit_Python: 저장소 저장소. Contribute to youngwoos/Doit_Python development by creating an account on GitHub. github.com ## 소득예측 모델 만들기 import pandas as pd import numpy as np import seaborn as sns df=pd.read_csv('./adult.csv') df 변수명 의미 age 나이 workclass 근로 형태 fnlwgt 인구통계 가중치 education 최종학력 education_num 교육기간 marital_status 결혼상태..

https://github.com/youngwoos/Doit_Python/tree/main/Data GitHub - youngwoos/Doit_Python: 저장소 저장소. Contribute to youngwoos/Doit_Python development by creating an account on GitHub. github.com ## 가설검증 1) 기술통계 (Descriptive statistics) --> 데이터를 요약해 설명하는 통계 분석 기법 ex) 사람들이 받는 월급을 집계해 전체 월급 평균을 구함 2) 추론통계 (Inferential statisctics) --> 어떤 값이 발생활 확률을 계산하는 통계 분석 기법 ex) 데이터에서 성별에 따라 월급에 차이가 있는 것으로 나타났을때, 이런..

## 인터랙티브 그래프 -> 마우스 움직임에 반응하며 실시간으로 모양 이 변하는 그래프입니다. https://github.com/youngwoos/Doit_Python/tree/main/Data GitHub - youngwoos/Doit_Python: 저장소 저장소. Contribute to youngwoos/Doit_Python development by creating an account on GitHub. github.com # 패키지 설치 # 패키지 설치 !pip install plotly #주피터 노트북 사용시 설치 !pip install jupyter-dash import pandas as pd df=pd.read_csv('./mpg.csv') df 1) 산점도 그래프 만들기 # 산점도 만들기..

## 지역별 특징을 지도로 구분해보자. https://github.com/youngwoos/Doit_Python/tree/main/Data GitHub - youngwoos/Doit_Python: 저장소 저장소. Contribute to youngwoos/Doit_Python development by creating an account on GitHub. github.com 서울시 동별 외국인 인구 단계구분도 만들기 1)서울시 동 경계 지도 데이터 준비하기 import pandas as pd import numpy as np import seaborn as sns import json geo=json.load(open('./EMD_Seoul.geojson',encoding='UTF-8')) #행정코드출..

https://github.com/youngwoos/Doit_Python/tree/main/Data GitHub - youngwoos/Doit_Python: 저장소 저장소. Contribute to youngwoos/Doit_Python development by creating an account on GitHub. github.com ## 기사 댓글 텍스트 마이닝 #방탄소년단이 '빌보드 핫 100 차느' 1위에 오른 소식을 다룬 네이버 뉴스 기사 댓글을 사용 1) 기사댓글불러오기 import pandas as pd import numpy as np import seaborn as sns df=pd.read_csv('./news_comment_BTS.csv',encoding='UTF-8') df # 데..

https://github.com/youngwoos/Doit_Python/tree/main/Data GitHub - youngwoos/Doit_Python: 저장소 저장소. Contribute to youngwoos/Doit_Python development by creating an account on GitHub. github.com ## 대통령 연설문을 통해서 텍스트 마이닝 분석 1) 패키지 설치 !pip install jpype1 !pip install konlpy 2) 데이터 불러오기 df=open('speech_moon.txt',encoding='UTF-8').read() df 3) 불필요한 문자 제거하기 --> [^가-힣] 은 '한글이 아닌 모든문자' 를 의미하는 정규 표현식입니다. # 불필..

## 파이썬을 통해 그릴 수 있는 그래프를 확인해보자. https://github.com/youngwoos/Doit_Python/tree/main/Data GitHub - youngwoos/Doit_Python: 저장소 저장소. Contribute to youngwoos/Doit_Python development by creating an account on GitHub. github.com 1) 산점도 - 변수 간 관계 표현하기 import pandas as pd import numpy as np import seanborn as sns df=pd.read_csv('./mpg.csv') df # x축 displ , y축은 hwy를 나타낸 산점도 만들기 sns.scatterplot(data=df,x='d..