Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
Tags
- 데이터크롤링
- pythonlearner
- 채용공고분석
- customeoperator
- datacrawling
- 올라마
- LDA
- featureimportance
- 오블완
- nrcemotionlexicon
- RapidMiner
- agglomerative clustering
- 파이썬러너
- 커스텀오퍼레이터
- causalanalysis
- 래피드마이너
- 토픽모델링
- 데이터
- 티스토리챌린지
- GoEmotions
- 통계개념
- 데이터분석
- 인과분석
- customoperator
- htmltags
- 머신러닝
- llma
- sentimentanalysis
- 텍스트마이닝
- 감성분석
Archives
- Today
- Total
목록nrcemotionlexicon (1)
마이와 텍스트마이닝
오늘은 제 논문의 연구에 대해서 말씀드리겠습니다. HelloTalk 언어 교환 앱의 리뷰를 분석했습니다. 연구 절차는 다음과 같아요. 이 글에 이 스텝들을 설명하려고 하겠습니다~ 이 글에 데이터 수집, 전처리 그리고 토픽모델링 부분에 대해서 만 이야기 하겠습니다. 1. 데이터 수집 [Data Collection]데이터를 google-play-scraper 패키지를 사용하여 Google Play Store의 HelloTalk 앱 리뷰를 크롤링하여 수집했습니다.df = pd.read_csv('hellotalk.csv') 2. 데이터 전처리 [Data Pre-processing] 데이터 정리 및 전처리:불용어, 테그 이모지 제거def remove_emojis(text): return emoji.repl..
텍스트마이닝
2024. 7. 8. 14:44