배경
스톡잇!은 주식을 처음 접하는 사람(주린이) 을 위한 서비스로 출발했습니다.
제가 느끼기에 일반 개인 투자자에게 주식은 진입 장벽이 매우 높은 영역이었습니다.
PER, PBR, ROE와 같은 각종 지표는 존재하지만, 이를 어떻게 해석해야 하는지 알려주는 서비스는 부족하다고 느꼈습니다.
그래서 저는
“지표를 잘 모르는 사람도 자신의 투자 성향을 이해할 수 있도록 도와줄 수 없을까?”
라는 질문에서 주식쌤을 개발하게 되었습니다.
단순히 정보를 나열하는 것이 아니라, '사용자가 실제로 어떤 주식을 사고 있는지' , '그 선택들이 어떤 투자 성향을 드러내고 있는지'를 기반으로 “아, 나는 이런 스타일의 투자자구나” 라고 스스로 깨닫게 해주는 것이 목표였습니다.
초기 아이디어: 투자 성향과 롤모델 매칭
초기에는 주린이도 이해할 수 있도록 쉽게 주식을 분석해주고 사용자의 포트폴리오를 분석한 뒤,
투자 성향이 비슷한 유명 투자자(롤모델) 를 추천하는 방식을 구상했습니다.
예를 들어,
- “당신은 워렌 버핏과 유사한 투자 성향을 가지고 있습니다.”
- “이 투자자는 어떤 철학으로 어떤 종목을 선택했는지 살펴보세요.”
이처럼 투자 성향 → 롤모델 → 학습 방향 제시로 이어지는 흐름을 만들고 싶었습니다.
문제
문제 1: 한국 주식과 해외 투자자의 불일치
그러나 곧 현실적인 문제가 발생했습니다.
유명한 투자자들의 포트폴리오는 대부분 미국 주식 기반이었습니다.
반면, Stockit 프로젝트는 한국 주식만을 다루고 있었기 때문에 다음과 같은 문제가 발생했습니다.
- 미국 주식과 한국 주식을 1:1로 매칭할 수 없음
- “워렌 버핏이 애플을 샀다” → “미국에서 애플은 스마트폰을 제조하니까 한국에서 스마트폰을 제조하는 삼성을 산 당신은 버핏 스타일이다”
와 같은 단순 치환은 명백히 논리적으로 성립하지 않음 - ‘워렌 버핏 스타일의 한국 주식’이라는 정답 데이터 자체가 존재하지 않음
즉, 학습 데이터 자체가 존재하지 않는 문제에 부딪히게 되었습니다.
문제 2: 한국 투자자 페르소나의 한계
그래서 롤모델을 한국 투자자로 전환하는 방안도 검토했습니다.
하지만 또 다른 문제가 있었습니다.
- 한국에서는 포트폴리오를 공개한 유명 투자자가 매우 적음
- 실제로 활용 가능한 인물이 3명 수준에 불과했음
- 이 정도의 페르소나 수로는 의미 있는 분류나 추천이 불가능
결과적으로 롤모델 기반 비교 방식 자체가 구조적으로 한계를 가진다는 결론에 도달했습니다.
가설
이 과정에서 제안받은 해결책이 룰 기반 페르소나 엔진이었습니다.
룰 기반 엔진이란?
- 사람이 직접 규칙(IF–THEN)을 정의
- 시스템은 해당 규칙을 기반으로 추론 및 판단 수행
- 예시:
- IF PBR < 1 AND ROE > 15% → 버핏 점수 +20
- IF 2차전지/바이오 비중 > 70% → 캐시 우드 점수 +30
장점
- 데이터 라벨링이 필요 없음
- 판단 근거를 설명하기 쉬움
- 빠른 구현 가능
그러나 선택하지 않은 이유
저는 이 방식은 적합하지 않다고 판단했습니다.
- 코스피·코스닥에 상장된 2,000개가 넘는 모든 주식을 사람이 if문으로 관리하는 것은 결국 대규모 하드코딩에 가깝다고 느꼈으며
- 주식의 종류와 특성이 늘어날수록 규칙 관리가 기하급수적으로 복잡해지며
- “기계가 스스로 학습한다”는 머신러닝의 본질과는 거리가 멀다고 느꼈기 때문입니다.
내가 원했던 방향: 머신러닝 기반 접근
제가 원했던 방향은 다음과 같습니다.
- 룰을 사람이 정의하는 것이 아니라
- 기계가 데이터를 보고 스스로 분류 기준을 학습하는 방식
즉,
- 룰 기반 엔진 → 사람이 규칙을 만든다
- 머신러닝 → 기계가 규칙을 발견한다
주식의 수는 매우 많고,
이를 사람이 일일이 규칙으로 정의하는 것은 확장성 측면에서도 적절하지 않다고 판단했습니다.
주식에는 정답이 없으니까요
최종 해결 전략
그래서 다음과 같은 구조를 선택했습니다.
1단계: AI로 주식 자체를 분류
- 다양한 재무·시장 데이터를 기반으로 주식을 클러스터링
- “이 주식들은 성향이 비슷하다”는 군집을 AI가 스스로 형성
2단계: 사용자 포트폴리오 분석
- 사용자가 구매한 주식들이 어떤 군집에 속하는지 분석
- 이를 통해 장투/단투, 가치주/성장주, 섹터 성향 등을 도출
※ 장기/단기 투자 성향은 최소 6개월 이상의 데이터가 필요하므로
현재는 데이터 수집 단계로 두고 있습니다.
3단계: 페르소나 매칭
- 군집의 특성을 기반으로
- 해외 유명 투자자의 투자 철학을 자서전, 위키피디아 등에서 조사
- 해당 성향을 직접 페르소나로 정의하여 연결
즉,
(1) AI가 주식을 먼저 분류하고
(2) 사용자의 투자 성향을 도출한 뒤
(3) 그 성향과 가장 유사한 투자 철학을 가진 롤모델을 매칭
하는 구조입니다.

다음 글에서는 “정답이 없는 주식 분류 문제, 왜 클러스터링을 선택했을까?”에 대해 다뤄보겠습니다.
'모의투자' 카테고리의 다른 글
| ~숫자를 언어로 번역하다 : 태깅~ 스톡잇! 개발기 #5 (1) | 2025.12.26 |
|---|---|
| ~숫자만 보고 주식을 나누다: K-means 클러스터링 과정~ 스톡잇! 개발기 #4 (0) | 2025.12.25 |
| ~학습에 적합한 형태로 변환하다 : 전처리 과정~ 스톡잇! 개발기 #3 (0) | 2025.12.18 |
| ~정답이 없는 주식 분류 문제, 왜 클러스터링을 선택했을까?~ 스톡잇! 개발기 #2 (0) | 2025.12.18 |
| ~Prologue: 투기가 아닌 투자의 길~ 스톡잇! 개발기#0 (1) | 2025.12.11 |