백테스트를 위한 파이썬2 [파이썬 퀀트] 4.3 데이터 갯수를 기준으로 grouping 하기 - qcut() 판다스의 데이터 프레임을 요리하는 방법을 정리하는 중이다. 정규 분포에서 1 영역과 2 영역과 3 영역과 4 영역의 Count 수, 즉 면적이 모두 같게끔 Grouping을 하는 방법에 대해서 알아보자. 현재 Read 한 데이터 프레임은 아래와 같다. 이 데이터 프레임을 PER 칼럼을 기준으로 3 영역으로 나누어 보도록 하겠다. 판다스에서 제공해 주는 qcut이라는 함수를 이용하면 된다. 데이터프레임과 영역을 인자값으로 넘겨주었다. 그럼 인덱스에 따라 category라는 타입 형태로 3가지가 생겼다. + (7.666, 16.495] + (16.495, 7056.129] + (-27857.497, 7.666] 그런데 타입 형태가 매우 직관적이지 않으므로 직관적인 형태로 변경해 보자. 아래와 같이 label.. 2023. 12. 22. FinanceDataReader에서 주가 데이터 연산하기 아래와 같은 코드를 사용하여 주가 데이터를 획득할 수 있습니다. 사용한 라이브러리는 FinanceDataReader입니다. import FinanceDataReader as fdr price_df = fdr.DataReader("005930", '2009-09-16', '2018-03-21') price_df.head() 그리고 005930 코드를 사용하여 삼성전자 주가 데이터를 획득할 수 있습니다. 획득한 데이터의 형태는 DataFrame입니다. 2009년 9월 16일부터 2018년 3월 21일까지의 데이터를 획득할 수 있습니다. 그럼 FinanceDataReader에서 제공해 주는 삼성전자의 전체 데이터를 구하고 싶을 때는 코드만 인자값으로 전달하면 됩니다. import FinanceDataReade.. 2023. 12. 4. 이전 1 다음