2025/04 6

sk네트웍스 family AI 캠프 11기 4월 4주차 회고록

회고기간 : 2025.04.21월~2025.04.25금이번 주차는 langchain에 대해 배웠다 LangChainLangChain 은 LLM의 기능을 확장하고 체계화하여 복잡한 애플리케이션을 구축할 수 있도록 지원하는 프레임워크다. 여러 프롬프트, 도구, 데이터 소스를 체인으로 연결해 효율적으로 작업을 수행할 수 있다.1. Prompt Template프롬프트 템플릿은 반복적인 작업에서 재사용 가능한 프롬프트를 설계하고, 동적 입력 변수를 통해 작업을 수행하는 구조자동화된 입력 구성대화형 응답샘플 기반 학습결과 파싱 키를 활용하기 전 환경변수를 로드하는 것은 필수! from dotenv import load_dotenvload_dotenv()프롬프트 예시 (few shot)from langchain.pr..

SKN/Remind 2025.04.28

sk네트웍스 family AI 캠프 11기 4월 3주차 회고록

회고기간 : 2025.04.14월~2025.04.18금이번 주차는 트랜스포머, bert, 허깅페이스 파이프라인, prompt engineering, local llm에 대해 배웠다. Transformerhttps://wikidocs.net/31379기존의 seq2seq 구조의 인코더-디코더 + attention 알고리즘을 구현한 모델[기존의 seq2seq 구조]인코더가 입력 시퀀스를 하나의 벡터로 압축하는 과정에서 입력 시퀀스의 정보가 일부 손실됨[transformer]병렬 처리와 전역 문맥 이해를 통해 RNN의 한계를 극복한 딥러닝 모델로, 인코더-디코더 구조와 어텐션 메커니즘을 기반으로 한다. * 어텐션입력 시퀀스의 중요한 부분에 가중치를 부여해 번역 품질을 향상시키는 메커니즘이다. 인코더: 입력 ..

SKN/Remind 2025.04.20

sk네트웍스 family AI 캠프 11기 4월 2주차 회고록

회고기간 : 2025.04.07월~2025.04.11금이번 주차는 NLP의 subword tokenizer, 워드 임베딩, 등을 배웠다. 0407월Subword Tokenizer- 서브워드 분리는 하나의 단어를 더 작은 단위로 쪼개 의미있는 조합으로 구성- 하나의 단어를 여러 서브워드로 분리해 단어를 인코딩 및 임베딩 할 수 있음import sentencepiece as spm# 모델 학습 input = 'naver_review.txt' # 학습해야 하는 학습 데이터셋 경로 vocab_size = 10000 # 결과로 만들 token의 개수 (사전의 크기)model_prefix = 'naver_review' # 학습에 대한 결과물 이름 지정 cmd = f'--input={inpu..

카테고리 없음 2025.04.20

백준 1149 rgb 거리 [python]

💡아이디어n개의 집을 rgb로 가지는 2차원 배열을 만들어서 최적 탐색을 한다  풀이과정먼저 arr 변수에 n개의 집을 이차원 배열로 만들어준다rgb 배열의 탐색 할 dp 배열을 초기화 해준 후 반복문을 통해 최솟값을 구하면 된다 코드import sysinput = sys.stdin.readlinen = int(input())arr = [list(map(int, input().split())) for _ in range(n)]dp = [[0] * 3 for _ in range(n + 1)] # dp[n]까지 만들기 위해 n+1 크기로dp[0] = [0, 0, 0] # 1번째 집부터 n번째 집까지 dp 채우기for i in range(1, n + 1): dp[i][0] = min(dp[i-1][..

Tech/Algorithm 2025.04.07

sk네트웍스 family AI 캠프 11기 4월 1주차 회고록

회고기간 : 2025.03.31월~2025.04.04금이번 주차는 프로젝트 발표와 NLP의 코사인 유사도, 전처리 등을 학습했다. NLTK설치!conda install nltk -yimport nltk# nltk 설치 후에는 기본 패키지들을 별도로 다운로드 해야함nltk.download('punkt')nltk.download('punkt_tab')nltk.download('stopwords') 토큰화from nltk.tokenize import word_tokenize, sent_tokenize단어 토큰화 (word_tokenize)단어 기준 토큰화['NLTK', 'is', 'a', 'powerful', 'library', 'for', 'NLP', '!', '!', '!']문장 토큰화 (sent_toke..

SKN/Remind 2025.04.07

sk네트웍스 family AI 캠프 11기 3월 4주차 회고록

8주차 회고기간 : 2025.03.24월~2025.03.28금 이번주차는ML : 추천 시스템 (코사인 유사도)DL : 딥러닝 최적 모델 학습 ~ 에 대해 배웠다 오차 역전법오차역전법에 대해 설명해놓은 블로그를 참고하자 !!https://velog.io/@nyulnyul/%EB%B0%91%EB%B0%94%EB%8B%A5%EB%B6%80%ED%84%B0-%EC%8B%9C%EC%9E%91%ED%95%98%EB%8A%94-%EB%94%A5%EB%9F%AC%EB%8B%9D1-%EC%98%A4%EC%B0%A8%EC%97%AD%EC%A0%84%ED%8C%8C%EB%B2%95 밑바닥부터 시작하는 딥러닝1 : 오차역전파법앞서 구현 했던 수치 미분은 단순하고 구현하기 쉽지만 계산시간이 오래 걸린다.(실제로 코드를 구현해 ..

카테고리 없음 2025.04.07