일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- kaggle
- pandas
- 정치인
- Instagrame clone
- TeachagleMachine
- FirebaseV9
- 강화학습 기초
- clone coding
- 딥러닝
- JavaScript
- 전국국밥
- 데이터분석
- 리액트네이티브
- 크롤링
- 클론코딩
- 조코딩
- 강화학습
- 카트폴
- coding
- expo
- python
- Ros
- redux
- selenium
- ReactNative
- App
- React
- 앱개발
- 사이드프로젝트
- 머신러닝
- Today
- Total
목록Python 데이터분석 (21)
qcoding
## kaggle 대회 자료를 통해 실습진행 https://www.kaggle.com/competitions/bike-sharing-demand/data Bike Sharing Demand | Kaggle www.kaggle.com 1) 데이터 불러오기 import pandas as pd import numpy as np import seaborn as sns # 데이터 불러오기 train=pd.read_csv('./train.csv') test=pd.read_csv('./test.csv') submission=pd.read_csv('./sampleSubmission.csv') # 데이터확인 train.head() # 데이터 파악하기 train.info() 2) 시각화를 위함 피처 엔지니어링 2-1) d..
## label encoding ## label encoding from sklearn.preprocessing import LabelEncoder fruits= ['사과','블루베리','바나나','귤','블루베리','바나나','바나나','사과'] # 레이블 인코더 생성 label_encoder=LabelEncoder() # 레이블 인코딩 적용 fruits_label_encoded=label_encoder.fit_transform(fruits) print(fruits_label_encoded) fruits_label_encoded.reshape(-1,1) -> 단점으로는 머신러닝에서는 숫자로 값을 판단하기 때문에 1와 2 의 관계가 1과 3의 관계보다 상관성이 높다고 판단할 수 있음. 실제로는 범주형 데..
https://github.com/youngwoos/Doit_Python/tree/main/Data GitHub - youngwoos/Doit_Python: 저장소 저장소. Contribute to youngwoos/Doit_Python development by creating an account on GitHub. github.com ## 소득예측 모델 만들기 import pandas as pd import numpy as np import seaborn as sns df=pd.read_csv('./adult.csv') df 변수명 의미 age 나이 workclass 근로 형태 fnlwgt 인구통계 가중치 education 최종학력 education_num 교육기간 marital_status 결혼상태..
https://github.com/youngwoos/Doit_Python/tree/main/Data GitHub - youngwoos/Doit_Python: 저장소 저장소. Contribute to youngwoos/Doit_Python development by creating an account on GitHub. github.com ## 가설검증 1) 기술통계 (Descriptive statistics) --> 데이터를 요약해 설명하는 통계 분석 기법 ex) 사람들이 받는 월급을 집계해 전체 월급 평균을 구함 2) 추론통계 (Inferential statisctics) --> 어떤 값이 발생활 확률을 계산하는 통계 분석 기법 ex) 데이터에서 성별에 따라 월급에 차이가 있는 것으로 나타났을때, 이런..
## 인터랙티브 그래프 -> 마우스 움직임에 반응하며 실시간으로 모양 이 변하는 그래프입니다. https://github.com/youngwoos/Doit_Python/tree/main/Data GitHub - youngwoos/Doit_Python: 저장소 저장소. Contribute to youngwoos/Doit_Python development by creating an account on GitHub. github.com # 패키지 설치 # 패키지 설치 !pip install plotly #주피터 노트북 사용시 설치 !pip install jupyter-dash import pandas as pd df=pd.read_csv('./mpg.csv') df 1) 산점도 그래프 만들기 # 산점도 만들기..
## 지역별 특징을 지도로 구분해보자. https://github.com/youngwoos/Doit_Python/tree/main/Data GitHub - youngwoos/Doit_Python: 저장소 저장소. Contribute to youngwoos/Doit_Python development by creating an account on GitHub. github.com 서울시 동별 외국인 인구 단계구분도 만들기 1)서울시 동 경계 지도 데이터 준비하기 import pandas as pd import numpy as np import seaborn as sns import json geo=json.load(open('./EMD_Seoul.geojson',encoding='UTF-8')) #행정코드출..
https://github.com/youngwoos/Doit_Python/tree/main/Data GitHub - youngwoos/Doit_Python: 저장소 저장소. Contribute to youngwoos/Doit_Python development by creating an account on GitHub. github.com ## 기사 댓글 텍스트 마이닝 #방탄소년단이 '빌보드 핫 100 차느' 1위에 오른 소식을 다룬 네이버 뉴스 기사 댓글을 사용 1) 기사댓글불러오기 import pandas as pd import numpy as np import seaborn as sns df=pd.read_csv('./news_comment_BTS.csv',encoding='UTF-8') df # 데..
https://github.com/youngwoos/Doit_Python/tree/main/Data GitHub - youngwoos/Doit_Python: 저장소 저장소. Contribute to youngwoos/Doit_Python development by creating an account on GitHub. github.com ## 대통령 연설문을 통해서 텍스트 마이닝 분석 1) 패키지 설치 !pip install jpype1 !pip install konlpy 2) 데이터 불러오기 df=open('speech_moon.txt',encoding='UTF-8').read() df 3) 불필요한 문자 제거하기 --> [^가-힣] 은 '한글이 아닌 모든문자' 를 의미하는 정규 표현식입니다. # 불필..