RAG on Chanyeol Dev

Spring AI RAG 워크플로우 분석: 사용자 질문부터 AI 답변까지의 여정 (6편)

Sun, 22 Mar 2026 14:30:00 +0900

[Dev-Fortune] 시리즈 다시보기

1. 서론: 조각난 퍼즐을 하나로 합치기

데이터의 이동이 일어나는 찰나의 순간, 서버 내부에서 일어나는 유기적인 상호작용을 파헤쳐 보겠습니다.

2. 전체 워크플로우 시퀀스 (Deep-Dive)

사용자의 엔터 키 한 번이 답변으로 돌아오기까지의 7단계 여정입니다.

sequenceDiagram autonumber User->>Controller: 고민 입력 (JSON) Controller->>Service: 사주 분석 요청 Service->>VectorStore: 고민 기반 유사도 검색 VectorStore-->>Service: 관련 사주 데이터 반환 Service->>AI: 프롬프트 조합 후 전달 (System+User) AI-->>Controller: 스트리밍 답변 생성 (Flux) Controller-->>User: SSE 응답 (실시간 텍스트)

3. 데이터 흐름의 5단계

요청 수신: JSON 고민 데이터 접수.
의미 검색: 사주 데이터 조각 탐색.
프롬프트 조합: 페르소나 + 지식 + 질문 결합.
추론 및 생성: AI의 인격이 투영된 답변 생성.
스트리밍 응답: 차가운 조언의 실시간 전달.

결국 데이터가 지능을 만들고, 프롬프트가 성격을 만듭니다.

Spring AI RAG 구현하기: SimpleVectorStore로 전문 지식 데이터 주입 (3편)

Thu, 19 Mar 2026 14:30:00 +0900

[Dev-Fortune] 시리즈 다시보기

1. 서론: AI는 어떻게 사주를 ‘공부’하는가?

AI에게 새로운 지식을 가르치는 방법 중 가장 경제적이고 정확한 RAG(Retrieval-Augmented Generation) 방식을 살펴봅니다. 질문이 들어올 때마다 관련 내용을 찾아서 읽어주며 답변하게 하는 원리입니다.

2. 데이터 주입 프로세스 (Data Ingestion)

JSON 파일이 어떻게 벡터화되어 메모리에 저장되는지 그 흐름을 도식화했습니다.

flowchart LR A[(sajuAPI.json)] --> B[DataLoader] B --> C[Text 정제: Key-Value형식] C --> D[Embedding Model] D --> E{SimpleVectorStore} E --> F[RAM Memory]

style F fill:#f96,stroke:#333,stroke-width:2px

3. SimpleVectorStore와 DataLoader

우리 프로젝트는 별도의 DB 없이 메모리 기반의 SimpleVectorStore를 사용합니다. UnidocuDataLoader는 서버 기동 시점에 JSON 데이터를 읽어 벡터로 변환하여 주입합니다.

// 텍스트 정제 예시
String content = String.format(
    "it_interpretation: %s\nanti_pattern: %s\nbad_habit: %s",
    item.get("it_interpretation"), ...
);

4. 유사도 검색(Similarity Search)

사용자가 “프로젝트 마감"에 대해 물으면, 벡터 저장소는 의미적으로 유사한 사주 데이터 상위 3개를 찾아 AI에게 전달합니다.

다음 4편에서는 이 데이터를 기반으로 시니컬한 말투를 생성하는 ‘프롬프트 엔지니어링’에 대해 다뤄보겠습니다.

Spring AI와 Ollama로 만드는 AI 개발자 사주 챗봇: 기획부터 스택 선정까지 (1편)

Tue, 17 Mar 2026 14:30:00 +0900

1. 프롤로그: 왜 ‘AI 개발자’ 사주인가?

전통적인 사주 풀이는 어렵고 따분합니다. “올해는 물의 기운이 강하니…” 같은 말은 현대의 개발자들에게는 다소 와닿지 않죠. 하지만 만약 **“실리콘밸리 출신의 천재 개발자”**가 당신의 인생을 코드로 보고 ‘디버깅’해준다면 어떨까요?

이 프로젝트는 바로 그 엉뚱한 상상에서 시작되었습니다. 감정 섞인 위로 대신, 건조하고 시니컬한 말투로 당신의 사주를 “안티 패턴"과 “배드 해빗(Bad Habit)“으로 분석해 주는 챗봇, **‘Dev-Fortune’**입니다.

2. 프로젝트 시스템 구조도

전체적인 데이터 흐름과 기술 스택을 한눈에 살펴보겠습니다.

graph TD A[사용자 고민 입력] --> B[Spring Boot Application] subgraph "Backend Stack" B --> C{Spring AI} C --> D[WebFlux/Streaming] C --> E[SimpleVectorStore] end subgraph "AI Engine" C -- HTTP:11434 --- F[Ollama: qwen2.5] end subgraph "Data Source" G[(sajuAPI.json)] --> E end B --> H[시니컬한 개발자 사주 답변]

3. 기술 스택 (The Stack)

Framework: Spring Boot 3.x
AI Library: Spring AI
LLM: Ollama (qwen2.5:3b)
Vector DB: SimpleVectorStore
Data Source: JSON 기반의 사주 풀이 데이터

4. 왜 Spring AI와 RAG인가?

일반적인 모델은 사주에 대한 지식이 파편화되어 있거나, 우리가 원하는 특유의 “개발자 스타일"로 대답하도록 통제하기 어렵습니다. 이를 해결하기 위해 우리는 RAG(Retrieval-Augmented Generation) 기법을 사용하여 전문 사주 데이터를 미리 벡터화해서 저장해 둡니다.

다음 편에서는 Ollama를 이용해 내 컴퓨터에 로컬 AI 환경을 구축하고 Spring Boot와 연결하는 방법을 알아보겠습니다.