정보게시판

  • 홈
  • 태그
  • 방명록

자연어 1

LSTM으로 스팸메일 분류하기

이번에는 "딥러닝을 이용한 자연어 처리 입문"에 게재된 스팸메일 분류하기를 통해 자연어처리(NLP)의 과정을 정리해보고자 한다. 본 내용은 10장의 RNN을 이용한 텍스트 분류의 내용이다. 데이터의 샘플 수 확인하기 ( 데이터 크기 확인 ) 데이터 타입과 결측값 확인 데이터 레이블 분포 확인 train데이터와 test데이터 생성 토큰화 단어등장 빈도 확인 ( 빈도수가 적은 단어 제거 ) LSTM으로 스팸 메일 분류 필요 라이브러리 설치 import numpy as np import pandas as pd import matplotlib.pyplot as plt import urllib.request from sklearn.model_selection import train_..

Data-Science/NLP 2022.01.31
이전
1
다음
더보기
프로필사진

정보게시판

  • 분류 전체보기 (8)
    • SQL (0)
    • Data-Science (3)
      • NLP (3)
    • 데이터 분석 (0)
    • Coding Test (1)
      • 백준 (1)
    • MLops (4)
      • Docker (2)
      • Kubernetes (0)
      • DVC (1)
      • MLflow (1)

Tag

pytorch, 도커, TF, dvc add, TensorFlow, KoBERT, rnn, 도커이미지, data version control, 문장관계, MLflow, Bert, lstm, 도커 명령어, Docker image, DVC, NLP, classification, docker, git checkout,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바