-
WordCloud : 시작하기 - 기초Selenium 2020. 2. 9. 00:44728x90
>>'Pandas : 시작하기 - 기초'에서 만든 json파일을 이용하였습니다.
1) Noun extraction
import pandas as pd from konlpy.tag import Twitter df = pd.read_csv('tweets.csv') string_list = "\n\n".join(df['content']) nlpy = Twitter() nouns = nlpy.nouns(string_list) print(nouns) nouns_str = '\n'.join(nouns)
['경산', '맛집', '경산', '송시몬', '피자', '이야기', '송', '시몬', '피자', '유키', '헤어', '경산', '미용실', '미용실', '경산', '맛집', '경산', '맛집', '정', '평동', '복어', '사람', '본점', '경북', '맛집', '경산', '맛집', '계양동', '맛집', '천골', '가마솥', '국밥', '소고기', '국밥', '한정식', '전문점', '담', '은정', '경산', '맛집', '인정', '출처', '마육', '기', '마', '블로그', '한정식', '전문점', '석쇠', '불고기', '된장찌개', '경산', '맛집', '한우', '곱창', '두', '번', '숙성', '곱', '꽉', '차고', '쏙', '리얼', '곱창', '출처', '미식', '돌스', '네이버', '한우', '곱창', '주소', '경상북도', '경산시', '로', '길', '대표', '전화', '메뉴', '소개', '곱창', '창구', '볶음밥', '경산', '맛집', '한우', '곱창', '두', '번', '숙성', '곱', '꽉', '차고', '쏙', '리얼', '곱창', '경산', '맛집', '중방동', '낙지', '맛집', '조방', '낙지', '경산', '맛집', '맛집', '리다', '빵', '출처', '마육', '기', '마', '블로그', '경산', '맛집', '경산', '맛집', '경산시', '장내', '대보', '식당', '돼지', '찌개', '맛', '집', '경산', '맛집', '선지국', '자인', '시장', '맛집', '추가', '공기밥', '맛', '경산', '맛집', '경산시장', '반찬', '가게', '타용', '짬뽕', '경산', '맛집', '대박', '이', '정도', '가격', '대비', '성능', '점', '광장', '맛집', '젊은이', '감성', '포차', '그루', '그루', '청포도', '막걸리', '봉', '철판', '해물', '볶음', '우동', '경산', '맛집', '영남대', '맛집', '신매역', '주변', '맛집', '출처', '김태훈', '기', '네이버', '블로그', '경산', '맛집', '경산', '옥산동', '맛집', '국물', '두루치기', '찌게', '맛집', '경산', '롯데', '시네마', '맛집', '경산', '맛집', '시지', '술집', '경산역', '경산', '이마트', '맛집', '대구', '돼지', '찌개', '경산', '곳', '곡', '출처', '경산', '맛집', '경산', '맛집', '경산', '맛집', '샘', '물', '경산', '맛집', '하양', '왕손', '짜장', '맛집', '경산', '맛집', '저렴', '카페', '베', '에스프레소', '경산', '맛집', '해물찜', '암산', '해물탕', '이사', '바로', '옆', '재', '오픈', '출처', '네이버', '블로그', '경산', '맛집', '영남대', '맛집', '앤쿡', '경산', '맛집', '미리', '금계', '찜닭', '대구', '한의대', '점', '경북', '맛집', '경산', '맛집', '갓바위', '맛집', '돌솥', '약손', '밥', '만드레', '약초', '취해', '돌솥', '약손', '밥', '맛집', '경산', '맛집', '녹슨', '드럼통', '경산', '맛집', '옥산동', '맛집', '경산', '국밥', '고기', '밥', '출처', '마육', '기', '블로그', '경산', '맛집', '대구', '맛집', '율', '맛집', '돼지', '화덕', '구이', '전문', '마닐마닐', '돼지', '삼겹살', '맛집', '대구', '율하동', '맛집', '화덕', '구이', '맛집', '대구', '로드', '맛집', '대구', '돼지', '맛집', '경산', '맛집', '맛집', '제주도', '젓갈', '소스', '겹살', '맛집', '대구', '경산', '맛집', '경산', '숯불', '갈비', '전원', '숯불', '지점', '솔직', '후기', '경산', '맛집', '염소', '맛집', '회나무', '염소', '식당', '경산', '맛집', '진량', '맛집', '잡', '밥집', '앤', '수육', '경산', '진량', '맛집', '경산', '진량', '경산', '맛집', '추천', '경산', '맛집', '막창', '출처', '마육', '기', '블로그', '경산', '맛집', '추천', '경산', '맛집', '복', '불고기', '특공대', '도지사', '인증', '복어', '사람', '메뉴', '혜자', '로움', '친구', '막걸리', '배', '경북', '경산', '맛집', '경산', '뷔페', '경산', '맛집', '추천', '경산', '뷔페', '수', '건강', '밥상', '수', '경산', '맛집', '장어구이', '국산', '국민', '보양식', '경산', '맛집', '장어구이', '국산', '국민', '보양식', '대한민국', '국민', '라면', '남녀', '노소', '막론', '온', '가족', '국민', '보양식', '장어구이', '장어', '구', '초복', '오지', '더위', '때문', '몸', '보신', '것', '경산', '전통', '어가', '서울', '삼계탕', '이', '맛', '면', '서기', '추천', '경산', '맛집', '경산', '맛집', '장어구이', '국산', '국민', '보양식', '경산', '맛집', '장어구이', '국산', '국민', '보양식', '대한민국', '국민', '라면', '남녀', '노소', '막론', '온', '가족', '국민', '보양식', '장어구이', '장어구이', '대표', '경산', '맛집', '자인', '육식', '소고기', '로스', '구이', '육회', '비빔밥', '경북', '경산시', '자인면', '유독', '소고기', '집', '그', '탓', '그', '상호', '식당', '대구', '경산', '쭈꾸미', '맛집', '쭈', '경산', '맛집', '경산', '쭈꾸미', '맛집', '쭈', '만', '맛집', '포스팅', '경산', '쪽', '볼일', '경산', '맛집', '쭈', '쭈꾸미', '맛집', '요즘', '쭈꾸미', '경산', '맛집', '소개', '허름', '집', '맛', '승부', '하양', '중남', '식당', '경산', '맛집', '소개', '허름', '집', '맛', '승부', '하양', '중남', '식당', '환성', '산', '산행', '마치', '백산', '회', '회원', '경산', '맛집', '경산', '찜', '탕수육', '천안문', '경산', '맛집', '경산', '탕수육', '경산', '찜', '탕수육', '경산', '중화요리', '집', '티비', '경산', '찜', '탕수육', '바로', '고고', '영남대', '택시', '타고', '남부', '주민', '센터', '택시', '정도', '경산', '맛집', '미성', '복어', '경산', '맛집', '영남대', '커피', '빵', '경산', '맛집', '영남대', '커피', '빵', '인강', '시험', '어제', '기분', '영남대', '제', '제일', '마지막', '중간고사', '친', '기분', '학교', '기말고사', '시험', '범위', '수업', '님', '제보', '경산', '맛집', '일차', '막창', '대구', '할머니', '때', '마다', '꼭', '곳', '막창', '구울', '때', '불쇼', '불', '때문', '놀란', '경산', '맛집', '진량', '맛집', '청진동', '해장국', '선지국', '집', '경산', '맛집', '엘레나', '가든', '샐러드', '바', '경산', '점', '엘레나', '가든', '메뉴', '엘레나', '가든', '가격', '경산', '맛집', '경산', '삼계탕', '정박', '삼계탕', '정박', '냉면', '삼계탕', '경산', '정박', '삼계탕', '위치', '경산', '맛집', '생', '오리', '역쉬', '경산', '맛집', '런던브릿지', '깜놀', '경산', '맛집', '동천', '면옥', '말', '맛', '경산', '맛집', '진못', '육식', '경산', '맛집', '번지', '삼계탕', '경산', '맛집', '번지', '삼계탕', '황', '기사', '맛집', '탐방', '기', '오늘', '소개', '경산', '맛집', '번지', '삼계탕', '요', '이집', '삼계탕', '오리', '요리', '전문', '맛집', '경산', '맛집', '천골', '가마솥', '국밥', '에스원', '임', '홍', '선임', '인연', '지금', '국밥', '인연', '자랑', '그', '이야기', '대구', '범어동', '맛집', '촌', '유원지', '맛집', '대구', '신암동', '맛집', '대구', '신천동', '맛집', '대구시', '맛집', '대구', '경산', '맛집', '대구', '방촌동', '맛집', '대구', '칠곡', '맛집', '경산', '맛집', '대구', '태전동', '맛', '피', '씨', '치킨', '배달', '전문점', '모집', '오븐', '닭', '닭', '돌닭', '찜닭', '경북', '경산', '맛집', '된장', '짜장면', '조화', '이색', '된장', '짜장', '정통', '천안문', '상상', '경산', '맛집', '경산', '한우', '맛집', '회식', '장소', '추천', '산청', '통', '한우', '경산', '맛집', '경산', '한우', '맛집', '회식', '장소', '추천', '산청', '통', '한우', '경산', '맛집', '청통', '한우', '인증샷', '경산', '맛집', '청통', '한우', '경산', '맛집', '고급', '정보', '출처', '경북', '으뜸', '음식점', '최상', '신선도', '맛', '자랑', '복어', '사람', '경산', '맛집', '대구', '맛집', '대구', '식객', '단', '작성자', '경산', '맛집', '곳', '정녕', '대구', '가야', '나', '러블리미', '경산', '맛집', '계양동', '맛집', '산호', '숯불', '아나고', '곰장어', '러블리미', '경북', '맛집', '경산', '맛집', '경북', '경산', '동해', '횟집', '가격', '짐', '횟집', '경산', '맛집', '정현', '천식', '식당', '육회', '양도', '푸짐하넹', '육회', '안주', '소주', '한잔', '러블리미', '경북', '맛집', '경산', '맛집', '막창', '월드컵', '경산', '일차', '막창', '님', '답글', '교회', '다시', '온', '경산', '중앙', '교회', '경산', '맛집', '이', '교회', '카페', '로뎀', '와플', '맛', '교회', '오늘', '사람', '사람', '경북', '맛집', '경산', '맛집', '빈', '재료', '정통', '중국요리', '코스', '요리', '럭셔리', '새로이', '오픈', '빈', '빈', '부제', '보기', '떡', '먹기', '경북', '맛집', '경산', '맛집', '전통', '력셔', '리', '중화요리', '집', '빈', '경산', '맛집', '자인', '장터', '선지국', '전통', '장터', '국밥', '피국', '장', '피국', '그릇', '선지국', '부제', '선지', '신선도', '괜츈', '피국', '경산', '맛집', '고래', '불', '닭발', '닭발', '살', '맛집', '출처', '경산', '맛집', '포항', '통닭', '대구', '경산', '쵝오', '맛집', '대구', '맛집', '경산', '맛집', '자료', '러브', '맘', '경산', '맛집', '여름', '휴가', '만난', '집', '복어', '사람', '경산', '본점', '거원', '트위터', '오늘이', '처음', '서리', '뭐', '트위터', '경산', '맛집', '합', '이번', '친정', '가면', '맜', '퍼', '서리', '쫌', '챠', '용', '경북', '경산', '맛집', '영대', '콩불', '콩나물', '불고기', '만남', '식당', '콩불', '영남대', '점', '메뉴', '콩불', '콩불', '연락처', '주소', '경북', '경']
2) Import Wordcloud
from wordcloud import WordCloud
3) Draw WordCloud
wordcloud = WordCloud(font_path='BMKIRANGHAERANG-TTF.ttf', background_color='white', width=1600, height=1200).generate(nouns_str) wordcloud.words_
{'경산 맛집': 1.0, '맛집': 0.35555555555555557, '경산': 0.34444444444444444, '맛집 대구': 0.16666666666666666, '경북': 0.14444444444444443, '한우': 0.1, '삼계탕': 0.1, '식당': 0.07777777777777778, '영남대': 0.07777777777777778, '국밥': 0.06666666666666667, '출처': 0.06666666666666667, '곱창': 0.06666666666666667, '대구': 0.06666666666666667, '추천': 0.06666666666666667, '국민 보양식': 0.06666666666666667, '돼지': 0.05555555555555555, '막창': 0.05555555555555555, '메뉴': 0.044444444444444446, '소개': 0.044444444444444446, '선지국': 0.044444444444444446, '진량': 0.044444444444444446, '쭈꾸미': 0.044444444444444446, '탕수육': 0.044444444444444446, '교회': 0.044444444444444446, '콩불': 0.044444444444444446, '복어 사람': 0.044444444444444446, '출처 마육': 0.044444444444444446, '마육 블로그': 0.044444444444444446, '맛집 맛집': 0.044444444444444446, '장어구이 국산': 0.044444444444444446, '국산 국민': 0.044444444444444446, '소고기': 0.03333333333333333, '전문점': 0.03333333333333333, '불고기': 0.03333333333333333, '네이버': 0.03333333333333333, '경산시': 0.03333333333333333, '자인': 0.03333333333333333, '가격': 0.03333333333333333, '하양': 0.03333333333333333, '구이': 0.03333333333333333, '숯불': 0.03333333333333333, '장어구이': 0.03333333333333333, '전통': 0.03333333333333333, '육회': 0.03333333333333333, '정박': 0.03333333333333333, '번지': 0.03333333333333333, '러블리미': 0.03333333333333333, '피국': 0.03333333333333333, '엘레나 가든': 0.03333333333333333, '피자': 0.022222222222222223, '이야기': 0.022222222222222223, '미용실': 0.022222222222222223, '사람': 0.022222222222222223, '본점': 0.022222222222222223, '계양동': 0.022222222222222223, '천골': 0.022222222222222223, '가마솥': 0.022222222222222223, '한정식': 0.022222222222222223, '블로그': 0.022222222222222223, '숙성': 0.022222222222222223, '차고': 0.022222222222222223, '리얼': 0.022222222222222223, '주소': 0.022222222222222223, '대표': 0.022222222222222223, '낙지': 0.022222222222222223, '찌개': 0.022222222222222223, '정도': 0.022222222222222223, '그루': 0.022222222222222223, '막걸리': 0.022222222222222223, '옥산동': 0.022222222222222223, '짜장': 0.022222222222222223, '카페': 0.022222222222222223, '바로': 0.022222222222222223, '오픈': 0.022222222222222223, '찜닭': 0.022222222222222223, '돌솥': 0.022222222222222223, '약손': 0.022222222222222223, '화덕': 0.022222222222222223, '전문': 0.022222222222222223, '염소': 0.022222222222222223, '뷔페': 0.022222222222222223, '대한민국': 0.022222222222222223, '라면': 0.022222222222222223, '남녀': 0.022222222222222223, '노소': 0.022222222222222223, '막론': 0.022222222222222223, '가족': 0.022222222222222223, '때문': 0.022222222222222223, '육식': 0.022222222222222223, '허름': 0.022222222222222223, '승부': 0.022222222222222223, '중남': 0.022222222222222223, '천안문': 0.022222222222222223, '중화요리': 0.022222222222222223, '택시': 0.022222222222222223, '커피': 0.022222222222222223, '시험': 0.022222222222222223, '기분': 0.022222222222222223, '일차': 0.022222222222222223, '오리': 0.022222222222222223, '오늘': 0.022222222222222223, '요리': 0.022222222222222223, '인연': 0.022222222222222223, '자랑': 0.022222222222222223, '된장': 0.022222222222222223, '정통': 0.022222222222222223, '회식': 0.022222222222222223, '장소': 0.022222222222222223, '산청': 0.022222222222222223, '청통': 0.022222222222222223, '신선도': 0.022222222222222223, '횟집': 0.022222222222222223, '부제': 0.022222222222222223, '장터': 0.022222222222222223, '닭발': 0.022222222222222223, '트위터': 0.022222222222222223, '서리': 0.022222222222222223, '송시몬': 0.011111111111111112, '시몬': 0.011111111111111112, '유키': 0.011111111111111112, '헤어': 0.011111111111111112, '평동': 0.011111111111111112, '복어': 0.011111111111111112, '은정': 0.011111111111111112, '인정': 0.011111111111111112, '석쇠': 0.011111111111111112, '된장찌개': 0.011111111111111112, '미식': 0.011111111111111112, '돌스': 0.011111111111111112, '경상북도': 0.011111111111111112, '전화': 0.011111111111111112, '창구': 0.011111111111111112, '볶음밥': 0.011111111111111112, '중방동': 0.011111111111111112, '조방': 0.011111111111111112, '리다': 0.011111111111111112, '장내': 0.011111111111111112, '대보': 0.011111111111111112, '시장': 0.011111111111111112, '추가': 0.011111111111111112, '공기밥': 0.011111111111111112, '경산시장': 0.011111111111111112, '반찬': 0.011111111111111112, '가게': 0.011111111111111112, '타용': 0.011111111111111112, '짬뽕': 0.011111111111111112, '대박': 0.011111111111111112, '대비': 0.011111111111111112, '성능': 0.011111111111111112, '광장': 0.011111111111111112, '젊은이': 0.011111111111111112, '감성': 0.011111111111111112, '포차': 0.011111111111111112, '청포도': 0.011111111111111112, '철판': 0.011111111111111112, '해물': 0.011111111111111112, '볶음': 0.011111111111111112, '우동': 0.011111111111111112, '신매역': 0.011111111111111112, '주변': 0.011111111111111112, '김태훈': 0.011111111111111112, '국물': 0.011111111111111112, '두루치기': 0.011111111111111112, '찌게': 0.011111111111111112, '롯데': 0.011111111111111112, '시네마': 0.011111111111111112, '시지': 0.011111111111111112, '술집': 0.011111111111111112, '경산역': 0.011111111111111112, '이마트': 0.011111111111111112, '왕손': 0.011111111111111112, '저렴': 0.011111111111111112, '에스프레소': 0.011111111111111112, '해물찜': 0.011111111111111112, '암산': 0.011111111111111112, '해물탕': 0.011111111111111112, '이사': 0.011111111111111112, '앤쿡': 0.011111111111111112, '미리': 0.011111111111111112, '금계': 0.011111111111111112, '한의대': 0.011111111111111112, '갓바위': 0.011111111111111112, '만드레': 0.011111111111111112, '약초': 0.011111111111111112, '취해': 0.011111111111111112, '녹슨': 0.011111111111111112, '드럼통': 0.011111111111111112, '고기': 0.011111111111111112, '마닐마닐': 0.011111111111111112, '삼겹살': 0.011111111111111112, '율하동': 0.011111111111111112, '로드': 0.011111111111111112, '제주도': 0.011111111111111112, '젓갈': 0.011111111111111112, '소스': 0.011111111111111112, '겹살': 0.011111111111111112, '갈비': 0.011111111111111112, '전원': 0.011111111111111112, '지점': 0.011111111111111112, '솔직': 0.011111111111111112}
import matplotlib.pyplot as plt plt.figure(figsize=(30,16)) plt.imshow(wordcloud) plt.axis("off") plt.savefig("tweets_bigdata_image"+".png", bbox_inches='tight') plt.show()
728x90'Selenium' 카테고리의 다른 글
Pandas 판다스 : 시작하기 - 기초 (0) 2020.02.09 Selenium 셀레니움 : 시작하기 (2) - 크롤링 기초 (0) 2020.02.08 Selenium 셀레니움 : 시작하기 (1) - 설치 (2) 2020.02.08