이번에는 "딥러닝을 이용한 자연어 처리 입문"에 게재된 스팸메일 분류하기를 통해 자연어처리(NLP)의 과정을 정리해보고자 한다. 본 내용은 10장의 RNN을 이용한 텍스트 분류의 내용이다. 데이터의 샘플 수 확인하기 ( 데이터 크기 확인 ) 데이터 타입과 결측값 확인 데이터 레이블 분포 확인 train데이터와 test데이터 생성 토큰화 단어등장 빈도 확인 ( 빈도수가 적은 단어 제거 ) LSTM으로 스팸 메일 분류 필요 라이브러리 설치 import numpy as np import pandas as pd import matplotlib.pyplot as plt import urllib.request from sklearn.model_selection import train_..