# lib
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns;sns.set()
import FinanceDataReader as fdr
import yfinance as yf
= fdr.DataReader('005930','2005-7-27','2022-1-17').iloc[:,0:4] #가격 수정되어 있음
df_ohlc = yf.download('005930.KS','2005-7-27','2022-1-17',auto_adjust=True).Volume # 수정거래량
volume_yf
= df_ohlc.join(volume_yf).dropna()
df_ohlcv = tautil.ohlcv(df_ohlcv)
df
= pd.read_csv('C:data/순매수량.csv')
quantity_ = quantity_.iloc[:-1,1:5]
quantity_ = ['Date','individual','foreign','institutional']
quantity_.columns = quantity_['Date'].apply(lambda x: pd.to_datetime(str(x), format='%Y%m%d'))
quantity_.index ='Date',inplace=True)
quantity_.drop(columns
= df.join(quantity_).dropna() df
머신러닝을 이용한 트레이딩: (1) 시장 데이터 수집
Get Market Data
trading
data
- 기간: 2005년 7월 27일부터 2022년 1월 17일 까지
- 삼성전자의 OHLCV(시가, 고가, 저가, 종가, 거래량)
- 투자주체별 거래량: 개인, 외국인 기관
파이썬 라이브러리인 FinanceDataReader와 yfinance을 이용한다. 순매수량 데이터는 대신증권 API로 받은 데이터를 이용한다.
모든 시장 데이터는 일별 데이터이다.
얻은 데이터는 뒤에서 시각화하기로 한다.