정보게시판

  • 홈
  • 태그
  • 방명록

Bert 2

SKTBrain KoBERT 텐서플로우로 돌리기

1. 데이터 소개 COLUMN: Premise | Hypothesis | label LABEL : "Contradiction", "Entailment", "Neutral" train.csv : 28998 row, 3 col test.csv: 1666 row, 3col submission.csv : 1666, 1col (label) train = pd.read_csv('train_data.csv') test = pd.read_csv('test_data.csv') submit = pd.read_csv('submission.csv') 2. Validation 데이터 생성 ** train 데이터와 validatoin데이터를 생성할 때 레이블값의 불균형이 생기면 안되기 때문에 랜덤 샘플링으로 데이터셋 구분 imp..

Data-Science/NLP 2022.01.31

문장 관계 분류 모델, KoBERT로 돌려보다

0. 목차 Bert를 사용하는 이유 Bert 활용 분야 코드 (tensorflow) 1. BERT를 사용하는 이유 "Attention is all you need"이라는 논문이 나온 이후로 자연어처리(NLP)분야는 더욱 빠르게 발전하기 시작했다. 논문에서 Transformer라고 이름을 붙힌 이 모델은 Attention layer를 활용하여 인코더(Encoder)와 디코더(Decoder)를 만들어 번역모델로도 사용하곤 했다. 추후 이 모델의 인코더 혹은 디코더만을 활용하여, 인코더(Encoder)로 BERT와 같은 모델을 만들었고, 디코더(Decoder)로 GPT와 같은 모델을 만들었다. 각각의 장점으로 인코더(Encoder)는 문장의 문맥을 인식하는 데 유리하고, 디코더(Decoder)는 문장 생성에 ..

Data-Science/NLP 2022.01.31
이전
1
다음
더보기
프로필사진

정보게시판

  • 분류 전체보기 (8)
    • SQL (0)
    • Data-Science (3)
      • NLP (3)
    • 데이터 분석 (0)
    • Coding Test (1)
      • 백준 (1)
    • MLops (4)
      • Docker (2)
      • Kubernetes (0)
      • DVC (1)
      • MLflow (1)

Tag

docker, NLP, 도커이미지, 도커 명령어, MLflow, rnn, lstm, TensorFlow, dvc add, Docker image, pytorch, git checkout, DVC, TF, data version control, 문장관계, Bert, KoBERT, classification, 도커,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바