일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- LDA
- causalanalysis
- 데이터분석
- featureimportance
- 감성분석
- 인과분석
- 티스토리챌린지
- htmltags
- 토픽모델링
- 텍스트마이닝
- 통계개념
- 파이썬러너
- GoEmotions
- agglomerative clustering
- 래피드마이너
- 데이터크롤링
- customeoperator
- 올라마
- 데이터
- sentimentanalysis
- nrcemotionlexicon
- 커스텀오퍼레이터
- datacrawling
- 머신러닝
- 채용공고분석
- customoperator
- 오블완
- RapidMiner
- llma
- pythonlearner
- Today
- Total
목록sentimentanalysis (2)
마이와 텍스트마이닝

이번에는 다양한 데이터셋과 기술을 사용하여 감성 분석을 수행할 것입니다. 목표는 텍스트에서 감정적 톤을 파악하고, 리부 데이터 안에서 가장 많은 영향을 주는 감정과 토픽을 파악하는 것입니다. 이를 위해 4가지 실험을 수행하였습니다.실험 설정실험 1: 토픽 가중치실험 2: NRC Emotion Lexicon 점수 + 토픽 가중치실험 3: GoEmotions 점수 + 토픽 가중치실험 4: NRC Emotion Lexicon 점수 + GoEmotions scores + 토픽 가중치저번에 데이터 전처리가 이미 완료된 데이터셋을 사용하였습니다: 이제 리뷰 점수를 바탕으로 감정 레이블을 지정하고, 긍정(1)과 부정(0)으로 표시하며, 중립(3) 점수는 제거했습니다. # Label encoding and labe..

감성 분석(Sentiment Analysis)은 텍스트에 나온 감정을 분석하는 자연어 처리(NLP)의 접근 방식입니다. 오늘 rating별로 리뷰를 positive/negative으로 나누어서 분석을 진행할것이고, 그 후에 모델링으로 성능을 평가 하도록 하겠습니다. 1. Importing libraries import pandas as pdimport numpy as npfrom cleantext import cleanfrom sklearn.feature_extraction.text import CountVectorizerfrom sklearn.feature_extraction.text import TfidfVectorizerimport collectionsimport matplotlib.pyplot ..