# lib
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns;sns.set()
import FinanceDataReader as fdr
import yfinance as yf
df_ohlc = fdr.DataReader('005930','2005-7-27','2022-1-17').iloc[:,0:4] #가격 수정되어 있음
volume_yf = yf.download('005930.KS','2005-7-27','2022-1-17',auto_adjust=True).Volume # 수정거래량
df_ohlcv = df_ohlc.join(volume_yf).dropna()
df = tautil.ohlcv(df_ohlcv)
quantity_ = pd.read_csv('C:data/순매수량.csv')
quantity_ = quantity_.iloc[:-1,1:5]
quantity_.columns = ['Date','individual','foreign','institutional']
quantity_.index = quantity_['Date'].apply(lambda x: pd.to_datetime(str(x), format='%Y%m%d'))
quantity_.drop(columns='Date',inplace=True)
df = df.join(quantity_).dropna()머신러닝을 이용한 트레이딩: (1) 시장 데이터 수집
Get Market Data
trading
data
- 기간: 2005년 7월 27일부터 2022년 1월 17일 까지
- 삼성전자의 OHLCV(시가, 고가, 저가, 종가, 거래량)
- 투자주체별 거래량: 개인, 외국인 기관
파이썬 라이브러리인 FinanceDataReader와 yfinance을 이용한다. 순매수량 데이터는 대신증권 API로 받은 데이터를 이용한다.
모든 시장 데이터는 일별 데이터이다.
얻은 데이터는 뒤에서 시각화하기로 한다.