Cho’s FinBlog
About
Source Code
Report a Bug
모든 글 보기
FinBlog
홈
모든 글 보기
기초통계
확률과 통계
확률 분포
추정
시계열 분석
1. 시계열 서론
2. 선형 모형
3. 다변량 시계열
4. 시계열 변동성
5. 비선형 모형
6. 상태 공간 모형
7. 머신러닝 딥러닝 모형
인과추론
1. 인과추론 서론
2. DAG
금융 데이터 처리
분수 차분
이상탐지
선행연구 - 딥러닝을 이용한 이상탐지
알고리즘 트레이딩
1. 트레이딩 개요
2. 시장 데이터 수집
3. 가격 모멘텀 라벨링
4. 피쳐 생성
5. 피쳐 선정
6. 매매 시그널 분류
7. 매매 규칙
8. 매매 신뢰도 측정과 전략 강화
시스템 리스크 분석
시스템 리스크 개념
시스템 리스크 측정
선행연구 요약
선행연구 (거시경제)
선행연구 (시장위험)
선행연구 (금융기관 위험)
선행연구 (부도확률모형 위험)
선행연구 (네트워크)
시스템 리스크와 머신러닝
선행연구1
선행연구2
향후 연구 방향
그래프 머신러닝
그래프 머신러닝 이론
1. 들어가며
2-1. 그래프 통계량과 커널
2-2. 이웃중복 감지
2-3. 라플라시안과 스펙트럼
3-1. 인코더-디코더
3-2. 랜덤워크 임베딩
4. 다중관계 데이터
5-1. GNN - 신경망 메시지 전달
5-2. GNN - 일반화된 집계 및 업데이트
5-3. GNN - 다중관계와 그래프 수준
자연어 처리
기초이론
1. DTM과 TF-IDF
2-1. 워드임베딩: Word2Vec
2-2. 워드임베딩: GloVe, FastText
3. 토픽모델링: LSA, LDA
4. 어텐션 메커니즘
5. 트랜스포머
6. BERT, GPT
선행연구
금융분야의 LLM (2023)
뉴스심리지수(NSI) - 한국은행
경제부문별 텍스트 지표
AI 알고리즘 이용 산업 모니터링
Categories
ARIMA
DAG
DTW
EM
GARCH
GMM
GNN
Kalman filter
LDA
LSA
MLE
VAR
anomaly detection
attention
bert
big data
causal inference
classification
cycle
data
deep learning
default
encoder-decoder
enhancing
entropy
estimation
fasttext
feature
feature selection
financial institution
fractional differentiation
glove
gpt
granger causality
graph
impulse response
knowledge graph
labeling
llm
machine learning
measures
moments
momentum
multi-relational
natural language processing
network
probability distribution
risk
sentiment
seq2seq
signals
spectral
stationarity
systemic risk
tfidf
time complexity
time series
topic modeling
trading
transformer
volatility
word embedding
word2vec
블로그 글
Order By
Default
Title
Author
경제부문별 텍스트 지표 (서범석, 2022)
sentiment
natural language processing
transformer
서범석(2022)에서 소개한 경제부문별 텍스트 지표를 소개한다. 또한 경기 예측 모형에 대한 내용도 포함한다.
Cheonghyo Cho
그래프 머신러닝: (1) 들어가며
graph
network
machine learning
Hamilton,W.L.
Graph Representation Learning
. 2020
Cheonghyo Cho
그래프 머신러닝: (2-1) 그래프 통계량과 커널 방법
graph
network
machine learning
Hamilton,W.L.
Graph Representation Learning
. 2020
Cheonghyo Cho
그래프 머신러닝: (2-2) 이웃 중복 감지
graph
network
machine learning
Hamilton,W.L.
Graph Representation Learning
. 2020
Cheonghyo Cho
그래프 머신러닝: (2-3) 그래프 라플라시안과 스펙트럴 방법
graph
network
machine learning
spectral
Hamilton,W.L.
Graph Representation Learning
. 2020
Cheonghyo Cho
그래프 머신러닝: (3-1) 이웃 재구성: 인코더-디코더
graph
network
encoder-decoder
Hamilton,W.L.
Graph Representation Learning
. 2020
Cheonghyo Cho
그래프 머신러닝: (3-2) 이웃재구성: 랜덤워크 임베딩
graph
network
encoder-decoder
Hamilton,W.L.
Graph Representation Learning
. 2020
Cheonghyo Cho
그래프 머신러닝: (4) 다중관계 데이터와 지식 그래프
graph
network
multi-relational
knowledge graph
Hamilton,W.L.
Graph Representation Learning
. 2020
Cheonghyo Cho
그래프 머신러닝: (5-1) GNN: 신경망 메시지 전달
graph
network
GNN
deep learning
Hamilton,W.L.
Graph Representation Learning
. 2020
Cheonghyo Cho
그래프 머신러닝: (5-2) GNN: 일반화된 집계 및 업데이트
graph
network
GNN
deep learning
Hamilton,W.L.
Graph Representation Learning
. 2020
Cheonghyo Cho
그래프 머신러닝: (5-3) GNN: 다양한 그래프
graph
network
GNN
deep learning
Hamilton,W.L.
Graph Representation Learning
. 2020
Cheonghyo Cho
금융 분야의 LLM (2023)
llm
natural language processing
최근 몇 년 동안 인공지능(AI)은 금융 분야 여러 영역에서 광범위하게 도입되고 있다.
Cheonghyo Cho
기초통계: 추정
MLE
estimation
GMM
EM
파라미터 추정 방법 중 MLE, GMM 등을 알아본다.
Cheonghyo Cho
기초통계: 확률 분포, 적률, 엔트로피
probability distribution
moments
entropy
AI 연구는 확률, 통계에 대한 기초적인 지식을 필요로 한다. 하지만, 확률, 통계를 공부했다고 하더라도, 잠시 관심을 꺼둔다면, 기초적인 지식조차도 금방 잊어버리기 마련이다. 필요할 때마다 찾아볼 수 있도록, 확률, 통계에 대한 간단한 기본 지식을 정리했다.
Cheonghyo Cho
뉴스심리지수 (한국은행)
sentiment
natural language processing
transformer
한국은행에서 발표한 통계치인 뉴스심리지수(NSI)를 소개한다. 트랜스포머(tranformer)를 사용하여 감성분석을 한다.
Cheonghyo Cho
딥러닝을 이용한 이상 탐지
anomaly detection
deep learning
이상탐지(Anomaly Detection)는 데이터에서 정상적인 패턴과 크게 벗어난 비정상적인 패턴을 식별하는 과정이다.
Cheonghyo Cho
머신러닝을 이용한 트레이딩: (0) 트레이딩 개요
trading
머신러닝을 이용한 모멘텀 예측과 전략 강화
Cheonghyo Cho
머신러닝을 이용한 트레이딩: (1) 시장 데이터 수집
trading
data
파이썬 라이브러리인
FinanceDataReader
와
yfinance
을 이용한다. 순매수량 데이터는 대신증권 API로 받은 데이터를 이용한다.
Cheonghyo Cho
머신러닝을 이용한 트레이딩: (2) 가격 모멘텀 라벨링
trading
labeling
momentum
삼성전자 종가를 기준으로 가격의 트렌드와 트렌드 강도(모멘텀)을 측정하여 이를 라벨(label)로 사용한다.
Cheonghyo Cho
머신러닝을 이용한 트레이딩: (3) 피쳐 생성
trading
feature
momentum
앞서 구한 시장 데이터를 이용하여 피쳐(feature)를 생성한다.
Cheonghyo Cho
머신러닝을 이용한 트레이딩: (4) 피쳐 선정
trading
feature selection
RFECV 기법으로 선정한 피쳐가 가장 좋은 성능을 보인다.
Cheonghyo Cho
머신러닝을 이용한 트레이딩: (5) 매매 시그널 분류
trading
signals
classification
machine learning
모멘텀 분류기 (Momentum Classifier)
Cheonghyo Cho
머신러닝을 이용한 트레이딩: (6) 매매 규칙
trading
Trading rules: 매수 진입만 허용
Cheonghyo Cho
머신러닝을 이용한 트레이딩: (7) 매매 신뢰도 측정과 전략 강화
trading
enhancing
machine learning
전략 강화 모형
Cheonghyo Cho
분수 차분 (fractional differentiation)
fractional differentiation
data
stationarity
시계열의 메모리를 어느정도 보존하면서 정상성을 만족하도록 차분해주는 “분수 차분(fractional diffentiation)”에 대해 알아보자.
Cheonghyo Cho
시계열 - 다변량 시계열
time series
VAR
granger causality
impulse response
DTW
시계열 분석을 정리하고자 한다. 다변량 자기회귀모형인 VAR모형과 충격반응(impulse response) 분석, Granger 인과관계, 공적분(cointergration) 등에 대해서 알아보자.
Cheonghyo Cho
시계열 - 머신러닝 딥러닝 모델
time series
deep learning
machine learning
시계열 분석을 정리하고자 한다. 머신러닝과 딥러닝을 이용한 시계열 분석에 대해 알아보자. 다만 각 모델에 대해서는 간단히 다룬다.
Cheonghyo Cho
시계열 - 변동성
time series
volatility
GARCH
시계열 분석을 정리하고자 한다. 시계열의 변동성 모델링(ARCH, GARCH 등), VaR 등에 대해 알아보자.
Cheonghyo Cho
시계열 - 비선형 모형
time series
시계열 분석을 정리하고자 한다. 시계열의 비선형 모델(TAR, STAR, Markov switching), 비모수 모델(kernel regression) 등에 대해 알아보자.
Cheonghyo Cho
시계열 - 상태 공간 모형
time series
Kalman filter
시계열 분석을 정리하고자 한다. 시계열의 상태공간 모델링에 대해 알아보자.
Cheonghyo Cho
시계열 - 서론
time series
시계열 분석을 정리하고자 한다. 시계열 데이터의 특징(자기상관, 정상성 등)에 대해 알아보자.
Cheonghyo Cho
시계열 - 선형 모형
time series
ARIMA
시계열 분석을 정리하고자 한다. ARIMA 등 선형 모델에 대해 알아보자.
Cheonghyo Cho
시스템 리스크 분석: (1) 시스템 리스크 개념
systemic risk
risk
시스템 리스크 (systemic risk):
금융중개기능이 원활히 작동하지 못하여 경제성장과 사회후생에 심각하게 손상을 줄 정도의 심각한 금융불안정을 지칭하는 시스템적 사건이 발생할 위험 - 유럽중앙은행(ECB(2010))
Cheonghyo Cho
시스템 리스크 분석: (2) 시스템 리스크 측정 방법 - 선행연구 요약
systemic risk
measures
시스템 리스크를 측정하는 기존의 방법에 대해 알아본다. 각 서베이 논문에서 정리한 표를 살펴보자.
Cheonghyo Cho
시스템 리스크 분석: (2-1) 거시경제지표를 활용한 경제전체 위험도 측정 방법
systemic risk
cycle
서상원 (2018)
Cheonghyo Cho
시스템 리스크 분석: (2-2) 시장위험 측정 방법
systemic risk
서상원 (2018)
Cheonghyo Cho
시스템 리스크 분석: (2-3) 금융기관 단면적 위험 측정방법
systemic risk
financial institution
서상원 (2018)
Cheonghyo Cho
시스템 리스크 분석: (2-4) 금융기관 부도확률 위험 측정방법
systemic risk
financial institution
default
서상원 (2018)
Cheonghyo Cho
시스템 리스크 분석: (2-5) 네트워크 측정방법
systemic risk
financial institution
network
서상원 (2018)
Cheonghyo Cho
시스템 리스크 분석: (3-1) 시스템 리스크와 머신러닝 - 네트워크 기반 및 빅데이터 분석
systemic risk
measures
network
machine learning
G. Kou
et al.
(2019)
Cheonghyo Cho
시스템 리스크 분석: (3-2) 시스템 리스크와 머신러닝 - 계량경제학, 미시구조, 금융규제
systemic risk
measures
network
machine learning
G. Kou
et al.
(2019)
Cheonghyo Cho
시스템 리스크 분석: (3-3) 시스템 리스크와 머신러닝 - 향후 연구 방향
systemic risk
network
big data
machine learning
G. Kou
et al.
(2019)
Cheonghyo Cho
알고리즘: 시간복잡도
time complexity
시간 복잡도는 알고리즘의 실행 시간이 입력 크기에 따라 어떻게 변화하는지를 나타내는 척도이다. 일반적으로 Big O 표기법을 사용하여 표현되며, 예를 들어
\(O(n), O(\log n), O(n^2)\)
등으로 표현된다.
Cheonghyo Cho
인과추론 - Directed Acyclic Graph(DAG)
causal inference
DAG
인과 경로
(causal pathway)를 명시적으로 나타냄.
Cheonghyo Cho
인과추론 - 서론
causal inference
인과관계(causation)를 상관관계(correlation)와 혼동하지 말자
Cheonghyo Cho
자연어처리: BERT, GPT
natural language processing
bert
gpt
BERT(Bidirectional Encoder Representations from Transformers)는 2018년에 구글이 공개한 사전 훈련된 모델, 트랜스포머를 이용하여 구현, 위키피디아(25억 단어)와 BooksCorpus(8억 단어)와 같은 레이블이 없는 텍스트 데이터로 사전 훈련된 언어 모델
Cheonghyo Cho
자연어처리: DTM, TF-IDF
natural language processing
tfidf
문서의 의미를 효과적으로 분석하기 위해서는 단어의 출현 빈도를…
Cheonghyo Cho
자연어처리: 어텐션 메커니즘
natural language processing
attention
seq2seq
Attention 메커니즘은 모델이 입력 시퀀스의 관련 부분에 선택적으로 집중할 수 있게 하여 자연어 처리부터 컴퓨터 비전까지 다양한 작업에서 성능을 향상시킨다. Seq2seq과 어텐션 메커니즘에 대해 알아보자.
Cheonghyo Cho
자연어처리: 워드임베딩 - Glove, FastText
natural language processing
word embedding
glove
fasttext
워드 임베딩(Word Embedding)은 자연어 처리(NLP)에서 단어를 고정된 크기의 실수 벡터로 변환하는 기술이다. 이번에는 GloVe와 FastText에 대해 알아보자.
Cheonghyo Cho
자연어처리: 워드임베딩 - Word2vec
natural language processing
word embedding
word2vec
워드 임베딩(Word Embedding)은 자연어 처리(NLP)에서 단어를 고정된 크기의 실수 벡터로 변환하는 기술이다. 이러한 벡터는 단어의 의미를 수치적으로 표현하며, 비슷한 의미를 가진 단어들은 유사한 벡터로 표현된다. 이 중 가장 대표적인 방법인 Word2Vec에 대해 알아보자.
Cheonghyo Cho
자연어처리: 토픽모델링 - LSA, LDA
natural language processing
topic modeling
LSA
LDA
토픽 모델링은 문서 집합 내에 존재하는 숨겨진 주제들을 자동으로 식별하고 추출하는 기술이다. 대표적인 방법으로는 잠재 의미 분석(LSA)과 잠재 디리클레 할당(LDA)이 있으며, 이들은 각각 통계적 및 확률적 접근법을 통해 문서의 주제 구조를 파악한다.
Cheonghyo Cho
자연어처리: 트랜스포머
natural language processing
transformer
attention
트랜스포머(Transformer)는 2017년 구글이 발표한 논문인 “Attention is all you need”에서 나온 모델로 기존의 seq2seq의 구조인 인코더-디코더를 따르면서도, 어텐션(Attention)만으로 구현한 모델이다.
Cheonghyo Cho
증권사 리포트 텍스트 분석
sentiment
natural language processing
bert
<서범석. 2023. “AI 알고리즘을 이용한 산업 모니터링: 증권사 리포트 텍스트 분석”, BOK 이슈노트 제 2023-5호, 한국은행.>을 소개한다. 이 연구는 자연어처리 등 통계 기법을 이용하여, 증권사 애널리스트의 기업 평가 보고서를 토대로 산업별 모니터링 정보를 추출하였다.
Cheonghyo Cho
No matching items
홈
확률 분포