성민이다아ㅏㅏ

  • 홈
  • 태그
  • 방명록

deepseek 1

DeepSeek 양자화 1.58B 사용 방법 정리

서론오랜만에 블로그에 복귀하면서, 요즘 인기를 끌었던 DeepSeek를 로컬 환경에서 다양하게 사용해 보았습니다. 기존에 한글 사용에 있어 Distill 모델들의 성능이 애매하다는 점 때문에, 이번에는 R1 모델에 눈을 돌리게 되었습니다. (참고로 Distill 모델들의 한국어 테스트 결과는 따로 정리해서 올리겠습니다.) 다만, R1 모델은 671B와 같이 매우 큰 파라미터 수로 인해 단순히 사용하기 어려운 점이 있었습니다. 일반적인 4bit, 8bit 양자화로도 크기가 부담스러웠는데, 그러던 중 unsloth의 1.58B 모델을 알게 되어 이를 활용하게 되었습니다.작업 환경기존의 R1 모델은 거대한 파라미터 수로 인해 여러 제한이 있었으나, unsloth에서 제공하는 1.58B 모델은 보다 실용적인 사..

NLP 2025.02.24
이전
1
다음
더보기
프로필사진

LLM으로 할 수 있는건 다 해봅니다!!

  • 분류 전체보기 (12)
    • NLP (10)
    • VISION (0)
    • 설정 (1)
    • 논문리뷰 (1)

Tag

LLM, AI, 자동 보고서 작성, langgraph, pdf 서식 추출, pdfplumber, deepseek, pdfminer, qwen-2.5-vl, ai 문서 자동화, NLP, ollama, pdf parser, langchain, qwen3, 멀티모달, local, 딥러닝, qwen2.5-vl, 코드제공,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바