Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- 데이터분석
- 래피드마이너
- htmltags
- 감성분석
- 데이터
- featureimportance
- nrcemotionlexicon
- 오블완
- 텍스트마이닝
- agglomerative clustering
- pythonlearner
- causalanalysis
- RapidMiner
- 파이썬러너
- 통계개념
- 데이터크롤링
- 커스텀오퍼레이터
- customeoperator
- customoperator
- 토픽모델링
- 채용공고분석
- 머신러닝
- llma
- datacrawling
- LDA
- 티스토리챌린지
- 올라마
- sentimentanalysis
- GoEmotions
- 인과분석
Archives
- Today
- Total
목록datacrawling (1)
마이와 텍스트마이닝

안녕하세요~~ 오늘은 Beautiful Soup을 사용해 웹사이트 데이터를 크롤링하는 방법에 대해서 이야기해볼게요! 제가 크롤링할 웹사이트는 ISRI라는 Information Systems 관련 모델과 구성 요소 정보가 있는 웹사이트입니다. 이 정보를 데이터프레임으로 정리하여 CSV 파일로 저장할 예정입니다. https://isri.sciencesphere.org/index.php?o=constructs 👉🏻 크롤링할 링크입니다. 이 링크에 다양한 construct들이 나열된 목록이 있습니다. 이 목록에 있는 각 construct의 링크에 들어가서 해당 construct의 이름, 정의, 이론/모델, 참조 정보들을 추출할 예정입니다. 그리고 이 데이터를 데이터프레임에 추가할거예요. # import l..
별도
2024. 11. 25. 16:39