papermill_step3 - Code Metrics - Aiscalate/aiscalator - Measure and Improve Code Quality continuously with Scrutinizer

papermill_step3 A
last analyzed 2020-07-24 19:29 UTC

↳ Parent: Project

Complexity

Total Complexity

Size/Duplication

Total Lines	88
Duplicated Lines	0 %

Importance

Changes

Metric	Value
wmc	0
eloc	44
dl	0
loc	88
rs	10
c	0
b	0
f	0

# ---
# jupyter:
#   jupytext:
#     cell_metadata_json: true
#     formats: ipynb,py:percent
#     notebook_metadata_filter: language_info
#     text_representation:
#       extension: .py
#       format_name: percent
#       format_version: '1.3'
#       jupytext_version: 1.5.2
#   kernelspec:
#     display_name: Python 3
#     language: python
#     name: python3
#   language_info:
#     codemirror_mode:
#       name: ipython
#       version: 3
#     file_extension: .py
#     mimetype: text/x-python
#     name: python
#     nbconvert_exporter: python
#     pygments_lexer: ipython3
#     version: 3.6.6
# ---

# %% {"tags": ["parameters"]}
# Our default parameters
# This cell has a "parameters" tag, means that it defines the parameters for use in the notebook
run_date = '2018-11-18'
source_id = 'sensor1'
nb_days = 7

# %%
from datetime import datetime, timedelta
import matplotlib.pyplot as plt
import os
import pandas as pd
from pylab import rcParams
import scrapbook as sb
import statsmodels.api as sm


# %%
data_dir = "../data/input/step1" 
data = None
run_datetime = datetime.strptime(run_date, '%Y-%m-%d')
for i in range(nb_days):    
    deltatime = run_datetime - timedelta(i)
    month_partition = deltatime.strftime("%Y-%m")
    delta = datetime.strftime(deltatime, '%Y-%m-%d')    
    file = os.path.join(data_dir, month_partition, delta + "-" + source_id + ".csv")
    if os.path.exists(file):
        print("Loading " + file)
        new = pd.read_csv(file)
        if data is not None:
            data = pd.concat([data, new])
        else:
            data = new

# %%
data['date'] = data['date'].apply(lambda x : datetime.strptime(x, "%Y-%m-%d %H:%M:%S"))
print(data['date'].describe())
data.describe()

# %%
data = data.sort_values('date').set_index('date', drop=True)
data = data.asfreq(freq="5min")
data.head(5)

# %%
pred = sm.load("../data/input/step2/prediction_model_" + run_date + "-" + source_id)

# %%
pred_ci = pred.conf_int()
rcParams['figure.figsize'] = 18, 8
fig, ax = plt.subplots()
ax.plot(data[data.index > (run_datetime - timedelta(3))]['mydata'], label='observed')
ax.plot(pred.predicted_mean, label='One-step ahead Forecast', alpha=.7)
ax.fill_between(pred_ci.index,
                pred_ci.iloc[:, 0],
                pred_ci.iloc[:, 1], color='k', alpha=.2)
ax.set_xlabel('Date')
ax.set_ylabel('mydata')
ax.set(title='Results on {}'.format(run_date))
fig.legend()

# %%





1			# ---
2			# jupyter:
3			# jupytext:
4			# cell_metadata_json: true
5			# formats: ipynb,py:percent
6			# notebook_metadata_filter: language_info
7			# text_representation:
8			# extension: .py
9			# format_name: percent
10			# format_version: '1.3'
11			# jupytext_version: 1.5.2
12			# kernelspec:
13			# display_name: Python 3
14			# language: python
15			# name: python3
16			# language_info:
17			# codemirror_mode:
18			# name: ipython
19			# version: 3
20			# file_extension: .py
21			# mimetype: text/x-python
22			# name: python
23			# nbconvert_exporter: python
24			# pygments_lexer: ipython3
25			# version: 3.6.6
26			# ---
27
28			# %% {"tags": ["parameters"]}
29			# Our default parameters
30			# This cell has a "parameters" tag, means that it defines the parameters for use in the notebook
31			run_date = '2018-11-18'
32			source_id = 'sensor1'
33			nb_days = 7
34
35			# %%
36			from datetime import datetime, timedelta
37			import matplotlib.pyplot as plt
38			import os
39			import pandas as pd
40			from pylab import rcParams
41			import scrapbook as sb
42			import statsmodels.api as sm
43
44
45			# %%
46			data_dir = "../data/input/step1"
47			data = None
48			run_datetime = datetime.strptime(run_date, '%Y-%m-%d')
49			for i in range(nb_days):
50			deltatime = run_datetime - timedelta(i)
51			month_partition = deltatime.strftime("%Y-%m")
52			delta = datetime.strftime(deltatime, '%Y-%m-%d')
53			file = os.path.join(data_dir, month_partition, delta + "-" + source_id + ".csv")
54			if os.path.exists(file):
55			print("Loading " + file)
56			new = pd.read_csv(file)
57			if data is not None:
58			data = pd.concat([data, new])
59			else:
60			data = new
61
62			# %%
63			data['date'] = data['date'].apply(lambda x : datetime.strptime(x, "%Y-%m-%d %H:%M:%S"))
64			print(data['date'].describe())
65			data.describe()
66
67			# %%
68			data = data.sort_values('date').set_index('date', drop=True)
69			data = data.asfreq(freq="5min")
70			data.head(5)
71
72			# %%
73			pred = sm.load("../data/input/step2/prediction_model_" + run_date + "-" + source_id)
74
75			# %%
76			pred_ci = pred.conf_int()
77			rcParams['figure.figsize'] = 18, 8
78			fig, ax = plt.subplots()
79			ax.plot(data[data.index > (run_datetime - timedelta(3))]['mydata'], label='observed')
80			ax.plot(pred.predicted_mean, label='One-step ahead Forecast', alpha=.7)
81			ax.fill_between(pred_ci.index,
82			pred_ci.iloc[:, 0],
83			pred_ci.iloc[:, 1], color='k', alpha=.2)
84			ax.set_xlabel('Date')
85			ax.set_ylabel('mydata')
86			ax.set(title='Results on {}'.format(run_date))
87			fig.legend()
88
89			# %%
90
91
92
93

Aiscalate / aiscalator

papermill_step3 A last analyzed 2020-07-24 19:29 UTC

Complexity

Size/Duplication

Importance

Duplication Side-by-Side

Filter issues like

papermill_step3 A
last analyzed 2020-07-24 19:29 UTC