CS log

[프로젝트] Leveraging LLM Reasoning Enhances Personalized Recommender Systems 본문

AI/NLP

[프로젝트] Leveraging LLM Reasoning Enhances Personalized Recommender Systems

sj.cath 2024. 11. 14. 16:51

프로젝트 요약

💗 주제명

사회 초년생을 위한 예/적금 금융 상품 추천

 

💗 분야

NLP, ML

 

💗사용 기술

Clustering Model, prompt engineering, RAG

 

💗선정 논문  

https://arxiv.org/abs/2408.00802

 

Leveraging LLM Reasoning Enhances Personalized Recommender Systems

Recent advancements have showcased the potential of Large Language Models (LLMs) in executing reasoning tasks, particularly facilitated by Chain-of-Thought (CoT) prompting. While tasks like arithmetic reasoning involve clear, definitive answers and logical

arxiv.org

 

💗 배경 및 목적

왜 이 프로젝트를 진행하는가? 목돈을 모으고 불리고자 하는 청년 세대들을 위해 시작한 프로젝트

해결하고자 하는 문제는 무엇인가? 은행 예/적금 관련 정보들이 여기저기 흩어져 있다. 그래서 이 정보를 수합하고 사용자의 상황(모아놓은 목돈 / 목돈을 예치할 수 있는 기간 / 목표하는 금액 / 사용자가 기존에 가입한 은행 상품 등)을 고려해 맞춤화 추천 시스템을 개발하고자 함.

 

💡전체적인 프로젝트 방향

클러스터링으로 고객을 여러 클래스로 나누고 각 클래스 별로 대표 고객 n명씩 선정한다. "그 고객들은 ~ 특성을 가지고 있으므로 ~ 상품을 추천하는 것이 적합하다" 라는 논리로 프롬프트를 생성해서 추천한다.

 

1. 고객 데이터 군집화 및 클래스별 대표 표본 추출

2. cot를 이용하여 클래스별로 llm 추론과정 차별화

3. UI/UX with Streamlit

 


더보기

논문 리뷰

 

CoT prompting 이란?

Chain of Thought(이하, CoT) 프롬프팅은 복잡한 추론 과정을 단계별로 설명하도록 유도하여 AI 모델의 문제 해결 능력을 향상시키는 기법이다. 이는 앞 선 시간에 살펴 본 프롬프트 체이닝(Prompt Chaining)과 유사해 보일 수 있지만, 중요한 차이점이 있습니다. 프롬프트 체이닝은 복잡한 태스크를 여러 개의 하위 태스크로 나누어 순차적으로 처리하는 방식인 반면, CoT 프롬프팅은 하나의 문제에 대한 추론 과정 자체를 단계별로 자세히 설명하도록 유도한다. CoT 프롬프팅에서는 중간 단계의 사고 과정을 명시적으로 표현함으로써, 최종 답안에 이르기까지의 논리적 연결고리를 강화하는 데 초점을 맞춘다.

 

제로샷 프롬프팅이란?

모델에 구체적인 예시를 제공하지 않고 주어진 작업을 수행하라고 요쳥하는 것

Abstract

 

Introduction

"REC-SAVER로 personalized recommendation을 수행하고, 그 성능을 평가하겠다."

이 논문은 대형 언어 모델(LLM)의 추론 능력과 특히 연쇄 사고(Chain-of-Thought, CoT) 프롬프트를 활용한 작업 수행 가능성에 대해 설명

기존의 산술 추론과 같은 명확한 답변을 요구하는 작업과 달리, 추천 시스템(RecSys)은 개인의 선호도와 주관성에 의존하는 특성이 있어, LLM의 추론 기능을 활용하는 데 독특한 과제임

이 연구는 LLM 추론을 개인화 추천에 적용하여 성능 향상을 도모하고, RecSAVER라는 평가 체계를 통해 인간의 평가 기준에 맞춰 자동으로 추론 품질을 평가하는 방법을 제안.

2. 방법론
추천 시스템 과제를 사용자의 피드백과 결정의 노력 정도에 따라 분류하고, 사용자 평점 예측 과제를 중심으로 연구

LLM은 사용자 과거 구매 이력을 분석해 예측에 사용한다.

CoT 프롬프트를 이용한 제로샷 학습을 통해 LLM이 예측 전에 추론 과정을 생성하도록 유도하며, 이를 Fine-tuning과 비교하여 성능 향상을 분석

3. Rec-SAVER: 추론 평가
RecSAVER는 LLM의 주관적인 추론을 평가하기 위해 개발되었다. 인간의 평가 없이 추론의 일관성과 신뢰성을 측정할 수 있는 프레임워크로, 모델이 생성한 설명을 바탕으로 일치 여부를 확인하는 방식으로 작동한다. 자가 검증 과정을 통해 모델이 신뢰할 만한 설명을 유지하는지 확인하여 평가 기준으로 사용한다.

4. 실험
아마존 리뷰 데이터셋을 사용하여 BEAUTY와 MOVIES/TV 두 가지 도메인에서 실험을 수행했다. 제로샷 CoT 방식이 직접 예측 방식보다 성능이 우수함을 보여준다. Fine-tuning 실험에서는 다양한 모델 크기와 학습 샘플 수, 필터링 방법을 통해 성능 변화를 관찰하며, 특히 큰 모델이 작은 모델보다 더 나은 성능을 보였다.

5. 추론 평가
RecSAVER를 사용하여 인간 평가와의 일관성을 분석하고, BLEU, ROUGE-1, METEOR, BERTScore와 같은 평가 지표가 추론 품질과 어느 정도 일치하는지 확인했다. 인간 평가와의 비교를 통해 RecSAVER가 신뢰할 만한 평가 도구임을 증명했다.

6. 관련 연구
LLM의 추천 시스템과 추론 관련 연구들을 개괄적으로 설명 ... 기존 연구들은 주로 사전 학습과 미세 조정 방식을 따랐으며, LLM이 추천 작업에 잘 적응할 수 있도록 학습하고, 개인화된 사용자 선호도 반영을 위해 특정 프롬프트 기법을 활용했다.

7. 결론과 논의
LLM의 추론을 추천 시스템에 적용했을 때 성능이 향상됨을 보였으며, RecSAVER가 추론의 품질을 평가하는 데 유용한 도구임을 확인했다.

 

도메인(금융) 지식 공부

 

거치식?

https://m.blog.naver.com/apocaly5787/221474614693

 

거치식예금 뭔뜻인지 모르면 읽어보세요

금융이 어려운 이유는 하나다. 그냥 용어가 어려운 거다! 나도 경제학, 금융 공부를 해온 사람이지만, 처음...

blog.naver.com

 

적립식 부금납입방식?

적립식 부금(savings-type premium)이라는 보험 상품에서의 납입 방식을 나타냅니다. 이 용어의 의미를 풀어보면 다음과 같습니다:

  1. 적립식: 이는 일정 기간 동안 일정 금액을 꾸준히 납입하여 그 금액을 적립해 나가는 방식입니다. 즉, 시간이 지남에 따라 일정 금액을 적립하고, 그 적립된 금액에 대해 이자가 붙거나, 해당 금액을 나중에 일정한 조건에 따라 환급받을 수 있습니다.
  2. 부금: 보통 '부금'은 금액을 꾸준히 일정한 기간 동안 납입하는 방식의 금융상품을 의미합니다. 예를 들어, 보험 상품에서는 매월 정해진 금액을 납입하면서 보험 혜택을 받거나, 특정 조건에 맞추어 납입한 금액을 돌려받는 형태입니다.
  3. 납입방식: 납입방식은 이 금액을 납입하는 방식, 즉 한 번에 납입하는지, 매달 일정액을 납입하는지 등을 정의합니다. "적립식 부금납입방식"은 매달 또는 일정 주기로 금액을 납입하고 이를 적립해 나가는 형태를 의미합니다.

결론적으로 적립식 부금납입방식은 일정 기간 동안 정기적으로 일정 금액을 납입하여 그 금액을 적립하고, 미래에 해당 금액에 대해 특정 혜택을 받는 금융 상품에서 사용되는 납입 방식입니다. 예를 들어, 적립식 보험이나 적립식 저축 상품이 여기에 해당할 수 있습니다.

 

회전예금?

일정 기간(회전주기)에 따라 예금금리가 시중금리에 따라 바뀌는 상품. 고객이 회전주기'를 1, 3, 6, 12개월 중에서 선정하면 예금 만기 때까지 회전주기가 지날 때마다 시중금리에 연동돼 예금금리가 변합니다.

 

국공채?

국공채란 공적인 기관이나 넓은 의미의 정부가 발행하는 채권으로서 일반 기업이 발행하는 회사채와는 구별된다.

 

일반채단기?

 

KIS단기종합채권지수(AA-이상)?

국내 단기채권시장을 대표하는 채권 750여 종목을 바탕으로 신용등급 AA- 이상, 잔존만기 6개월~1년, 발행잔액 500억원 이상인 채권으로 구성된 지수

 

권역별 해외주식?

해외 주식을 투자할 때 지역별로 구분한 주식. 권역별로 주식을 나누는 이유는 각 지역의 경제 상황, 산업 특성, 정치적 요소 등이 주식 시장에 큰 영향을 미치기 때문에, 지역별 특성을 고려해 투자하는 것이 유리할 수 있기 때문!

-> 권역별 해외주식 분류 예시
1. 미국 주식 : 뉴욕 증권거래소(NYSE)와 나스닥(NASDAQ) 등의 시장에 상장된 미국 기업들로, 애플, 마이크로소프트, 테슬라 같은 글로벌 대형 기업
2. 유럽 주식: 독일, 프랑스, 영국 등 유럽 국가의 주식 시장에 상장된 기업들로, 유로존 경기 변동에 영향을 받습니다. 대표적으로 영국의 BP, 독일의 폭스바겐 등
3. 아시아 주식: 일본, 중국, 한국 등 아시아 국가에 상장된 기업들이며, 소니, 알리바바, 삼성전자 같은 아시아 대표 기업
4. 신흥 시장 주식: 남미, 동남아시아, 아프리카 등 경제 성장 가능성이 큰 신흥국들의 주식으로, 높은 성장 가능성과 동시에 변동성도 큼

 

TDF(Target Date Fund)란?

TDF는 현재 미국에서 가장 각광받는은퇴준비 상품으로 투자자의 은퇴시점을 목표로 하여 생애주기에 따라 적극적인 투자에서 안정적인 투자로 포트폴리오를 알아서 조정하는 자산배분 펀드

 

액티브 투자?

주식 또는 채권 기반 뮤추얼펀드와 멀티에셋펀드와 같이 시장 평균보다 높은 수익률을 창출하고자 하는 투자를 말한다.

 

패시브 ETF?

특정 지수(예: S&P 500, 코스피 200)를 그대로 추종하는 방식으로 운용되는 펀드

 

EPS 성장률?

한 기간 동안의 EPS가 이전 기간의 EPS에 비해 얼마나 증가했는지를 나타냅니다. 이는 기업의 성장 속도와 수익성 증가 추세를 평가하는 데 중요한 지표. EPS 성장률이 높은 기업은 시장에서 빠르게 성장하고 있다는 의미

 

MSCI?

Morgan Stanley 에서 발행하는 지수

https://namu.wiki/w/MSCI%20지수

 

MSCI 지수

Morgan Stanley Capital International Index 홈페이지 모건 스탠리 의 자회사인 모건

namu.wiki

 

ETF?

https://m.samsungfund.com/etf/insight/guide/view01.do

 

ETF 소개 | ETF 투자기초가이드 | Kodex

ETF 투자의 기초부터 심화까지 알아보세요.

www.samsungfund.com

 

모투자신탁의 자투자신탁?

1. 모투자신탁 (Master Fund)
모투자신탁은 전체 펀드 구조의 중심이 되는 주(主) 펀드 역할을 합니다.
투자 자산의 실질적인 운용은 모투자신탁이 담당합니다. 즉, 모투자신탁이 주식, 채권, 파생상품 등 여러 자산에 투자하여 수익을 창출합니다.
자투자신탁으로부터 자금을 받아 투자하고 운용합니다.
모투자신탁은 규모가 큰 하나의 펀드이므로, 투자 비용이 절감되며, 자산 관리가 더 효율적입니다.

2. 자투자신탁 (Feeder Fund)
자투자신탁은 여러 개의 펀드를 각각 개별적으로 투자하는 것이 아니라, 모투자신탁에 투자하는 구조를 가집니다.
즉, 자투자신탁은 투자자들로부터 자금을 모아 모투자신탁에 투자하는 역할을 합니다.
자투자신탁은 여러 개일 수 있으며, 각 자투자신탁이 동일한 모투자신탁에 자금을 투입하여 간접적으로 운용 성과를 공유합니다.
자투자신탁은 모투자신탁을 통해 운용되므로, 투자 규모에 따른 비용을 절감할 수 있고, 개별적인 투자 전략을 설계하지 않아도 됩니다.

 

섹터별 주식?

https://uppity.campaignus.me/serial/?bmode=view&idx=6673097

 

[미주 다이어리] 미국주식 섹터별 대장주 공부하기 💵 : SERIAL

전 세계 주식시장에 상장돼있는 주식들은 ‘섹터’ 단위로 분류할 수 있습니다. 섹터는 글로벌 산업분류기준(GICS)에 따라, 에너지, 소재, 산업재, 임의소비재, 필수소비재, 헬스케어, 금융, 정보

uppity.campaignus.me

 


 

수신상품?

입출금이 자유로운 예금으로 보통예금, 저축예금, 기업자유예금이 있으며, 거치식예금에는 정기예금, 표지어음, 적립식예금에는 신용부금, 자유적립예금, 정기적금, 장기주택마련저축 등이 있다.

수신 = 신뢰를 받다. (은행이 고객으로부터)

 

당좌 예금(當座預金)?

회사 또는 개인영업자가 빈번한 금전 지불의 사무를 은행에 대행시키기 위해 이용하는 예금이다. 예금의 환불을 반드시 수표로 하는 것이 특색이다. 당좌 예금은 상업거래상 가장 많이 이용되는 것으로서 완전한 영업 예금의 성격을 가진다.

 

표지어음?

금융기관들이 기업이 발행한 어음을 할인해 사들인뒤 이 어음을 근거로 은행을 지급인으로 자체 어음을 발행해 일반투자자에게 파는 어음이다.

 

어음? 

어음은 발행하는 사람이 미래의 일정한 금액을 일정한 시기와 장소에서 무조건 지급할 것을 약속하거나(약속어음) 또는 제3자에게 그 지급을 위탁하는(환어음) 유가증권이며, 주로 기업체에서 사용한다.

 

환매조건부매매?

https://news.einfomax.co.kr/news/articleView.html?idxno=4180081

 

[시사금융용어] 환매조건부매매(RP·Repurchase Agreement) - 연합인포맥스

◆ 환매조건부매매(RP·Repurchase Agreement)는 매매 당사자 사이에 일방이 상대방에게 유가증권을 일정 기간 경과 후 일정 가액으로 환매수(도)키로 하고 매도(수)하는 거래를 말한다. 일반적인 유가

news.einfomax.co.kr