성민이다아ㅏㅏ

  • 홈
  • 태그
  • 방명록

deepseek 1

DeepSeek 양자화 1.58B 사용 방법 정리

서론오랜만에 블로그에 복귀하면서, 요즘 인기를 끌었던 DeepSeek를 로컬 환경에서 다양하게 사용해 보았습니다. 기존에 한글 사용에 있어 Distill 모델들의 성능이 애매하다는 점 때문에, 이번에는 R1 모델에 눈을 돌리게 되었습니다. (참고로 Distill 모델들의 한국어 테스트 결과는 따로 정리해서 올리겠습니다.) 다만, R1 모델은 671B와 같이 매우 큰 파라미터 수로 인해 단순히 사용하기 어려운 점이 있었습니다. 일반적인 4bit, 8bit 양자화로도 크기가 부담스러웠는데, 그러던 중 unsloth의 1.58B 모델을 알게 되어 이를 활용하게 되었습니다.작업 환경기존의 R1 모델은 거대한 파라미터 수로 인해 여러 제한이 있었으나, unsloth에서 제공하는 1.58B 모델은 보다 실용적인 사..

NLP 2025.02.24
이전
1
다음
더보기
프로필사진

LLM으로 할 수 있는건 다 해봅니다!!

  • 분류 전체보기 (12)
    • NLP (10)
    • VISION (0)
    • 설정 (1)
    • 논문리뷰 (1)

Tag

ollama, AI, pdfminer, 코드제공, qwen2.5-vl, LLM, deepseek, pdfplumber, local, pdf 서식 추출, 멀티모달, pdf parser, 딥러닝, NLP, langchain, 자동 보고서 작성, langgraph, ai 문서 자동화, qwen3, qwen-2.5-vl,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/05   »
일 월 화 수 목 금 토
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바