[Project] 전력사용량 예측 프로젝트 (feat. LSTM)
국내 전력시장은 크게 수도권과 비수도권으로 구분되어 있는데, 인구의 수도권 집중화로 인해 수도권의 전력수요가 크게 증가하고 있습니다. 이로인해 전력 수급 불균형 이슈가 발생하고 있습니다.
수도권 대부분의 전력은 비수도권에 있는 발전소로부터 공급 받게 되는데, 송전용량의 한계 문제로 수도권으로 공급할 수 있는 전력량에 한계가 있습니다. 수도권의 과밀화가 지속적으로 진행되면 공급부족 및 블랙아웃이 발생할 수 있는 것이죠.
반대로 비수도권이나 제주도의 경우에는 발전소와 신재생에너지로부터 필요충분한 전력을 공급 받고 있습니다. 하지만 신재생에너지의 과도한 공급으로 비수도권은 전력 과잉공급 현상을 우려하고 있습니다.
지역별 전력 불균형 현상에 대응하기 위해 한국전력은 송변전 설비계획을 실시하고, 고압송전 전력망을 구축하고자 노력하고 있고, 전력거래소에서는 [전력수요반응제도(DR)], [재생에너지 발전량 예측제도] 등을 활용하여 수요 안정화에 기여하고 있습니다.
수요반응제도는 전력 수요를 관리하고 조절하기 위한 프로그램으로, 전력수급 상황에 따라 참여고객이 전력 수요를 줄일 때 금전적 보상을 지급하는 제도입니다.
전력사용량 예측 프로젝트는 유연한 소비 조정과 효과적인 전력 운영으로 전력 소비자에게 경제적 이익을 제공하고, 수요 감축을 통한 전력계통망 안정성에 기여하기 위한 목적으로 진행됩니다.
전력거래소에서 운영하는 재생에너지 발전량 예측제도가 있지만, 신재생에너지를 대상으로 운영하고 있습니다. 프로젝트는 신재생에너지뿐만 아니라, 일반 상업 빌딩, 제조공장, 물류공장에 대한 전력량 예측을 통해서 사업자가 전력사용량을 절감할 수 있다면 전력 불균형 문제를 조금이나마 해소할 수 있지 않을까 생각됩니다.
1. 데이터 설명
- 분석에 사용된 데이터는 상업빌딩의 시간대별 전력사용량 데이터 입니다.
- 2020년 6월 ~ 8월까지의 전력 데이터를 활용하였습니다.
2. 데이터 분석 방향
- 전력사용량에 대한 예측이 목적이므로 시계열 데이터 분석을 진행합니다.
- 시계열 데이터는 정상성 확보가 우선이므로 ACF, ADF 검정을 실시하여 데이터를 검정합니다.
- 데이터 전처리 후, 시계열 딥러닝 모델링을 위해 LSTM을 활용합니다.
- 모델링 후, 성능 평가는 실제값과 예측값의 오차율 지표인 MADE를 활용합니다.
3. 데이터 확인
데이터셋 각 Feature의 데이터 종류는 아래와 같습니다.
데이터 종류에 따라 분석 및 모델링 방향이 바뀌므로 초기 모델은 전력사용량(kWh) 데이터만 활용하겠습니다.
4. ACF, ADF 검정
ADF 검정은 시계열 데이터의 정상성을 검정하는 기법으로 p-value가 0.05이하이므로 귀무가설을 기각하고 정상성을 가진 데이터로 판단할 수 있습니다. 즉 예측 모델 훈련에 활용할 수 있는 데이터임을 확인하였습니다.
ACF 검정은 자기상관에 대한 분석 기법으로 과거시점(lag)의 데이터와 얼마나 상관성이 있는지 확인할 수 있는데, 2일차까지는 상관성이 있다고 볼 수 있겠습니다. 추후에 ACF의 검정 결과를 모델에 활용해보겠습니다.
5. 데이터 전처리 및 모델링
딥러닝 모델인 LSTM은 3차원 배열의 데이터셋을 입력 받습니다. 그러므로 훈련용 데이터셋을 3차원 배열로 변환하고 모델링을 진행하였습니다. LSTM에 활용되는 Time Step은 48시간으로 설정하고 다음 시간대에 대한 전력사용량을 예측하는 모델을 생성하였습니다.
훈련용 데이터셋으로 LSTM모델을 훈련한 후, 테스트용 데이터셋으로 평가 하였는데, 실제값과 유사한 수치로 나타났습니다. 예측값이 실제값과 유사하게 나타난 이유는 해당 상업빌딩의 전력사용량 패턴이 일정하기 때문으로 판단되고, 좀 더 불규칙한 전력사용량 패턴을 보이는 빌딩은 오차율이 증가할 것 입니다.
[단일시간대 예측모델]
이번에는 24시간에 대한 전력사용량을 예측하는 모델을 생성하였습니다. 예측구간이 길어지고, 현재 시점으로부터 멀어짐에 따라 오차율이 단일시간 예측 모델 대비 상승하였으나, 차분, Rolling 등의 시계열 분석 지표를 반영하여 예측률 소폭 개선 할 수 있었습니다.
전력량의 정상성이 확보된 빌딩의 경우 예측이 잘 되었는데, 비정상성이 강한 빌딩은 오차율이 커서 다른 방법을 찾아야 할 것 같습니다.
[24시간 전력사용량 예측모델]
6. 전력사용량 시계열 모델링 결과
상업빌딩에 대한 시계열 모델링을 수차례 수행한 결과, 전력사용량 변동폭이 크고, 불규칙한 패턴을 보이는 빌딩의 오차율이 증가하였습니다. 또한 빌딩별로 모델 학습이 필요하다보니, 많은 빌딩을 한번에 학습하기에 시간이 오래 걸리는 단점이 있었으므로 이에 대한 대응법도 생각해봐야 하겠습니다.
정상성이 확보된 빌딩은 해당 모델을 통해 수요 예측 지표로 활용 가능할 것으로 보입니다.
감사합니다.