import requests
import pandas as pd
import numpy as np
import time
import datetime as dt
import json

import plotly as plt
import plotly.express as px
import plotly.graph_objects as go
import seaborn as sns

from tim import Tim
pd.set_option('mode.chained_assignment', None)


with open('credentials.json') as f:
    tim_credentials = json.load(f)                          # loading the credentials from credentials.json
    
TIM_URL = 'https://tim-platform.tangent.works/api/v5'       # URL to which the requests are sent

tim_client = Tim(email = tim_credentials['email'], password = tim_credentials['password'], endpoint = TIM_URL)


data = pd.read_csv('panel_data_retail.csv', sep=',')                           # loading data from panel_data_retail.csv
display(data.head())                                                           # Quick look at the data
data.tail()


data_configuration = {                                                         # Upload dataset configuration
    'name': 'panelDataRetail',
    'timestampColumn': 2,
    'groupKeys': ['Store']
}

upload_results = tim_client.upload_dataset(dataset = data, configuration = data_configuration)   # Upload dataset via python client

dataset_id = upload_results.dataset['id']                                      # Read dataset id
version_id = upload_results.dataset['latestVersion']['id']                     # Read dataset version id

print("Dataset id:         ", dataset_id)                                      # Display dataset id and dataset version id
print("Dataset version id: ", version_id)

Dataset id:          f212fc52-6502-4878-850e-263577803630
Dataset version id:  b9f10778-08f1-48e2-8ab6-a09c40281c05


store = 1
namesPred = data.columns[3:]
v_data = data[data.Store == store]
v_data = v_data.sort_values("Date")
fig = go.Figure(go.Scatter(x=v_data.Date, y=v_data.Weekly_Sales, name='Weekly_Sales', line=dict(color='black')))
for p in namesPred:
    fig.add_trace(go.Scatter(x=v_data['Date'], y=v_data[p], name=p))
fig.update_layout(height=500, width=1000, title_text=f"Data visualization store {store}")
fig.show()


outOfSampleRows = 45                                                          # Use last 45 samples as out of sample data
predictionTo = 4                                                              # Prediction horizon 4 samples
outOfSampleStores = [1,3,6]                                                   # Stores removed from training
inSampleStores = list(set([*range(1, 46)])-set(outOfSampleStores))            # Stores on which the model is build

job_configuration = {                                                         # Configuration of store
    "configuration": {
        "predictionTo": {"baseUnit": "Sample","value": predictionTo},
        "rollingWindow": {"baseUnit": "Sample","value": 1},
        "offsetLimit":{ "value": -10},
        "features": [ "Periodic", "Intercept", "PiecewiseLinear", "TimeOffsets", "Polynomial", "Identity", "Month", "Fourier" ]
    },
    "data": {
        "outOfSampleRows": {"baseUnit": "Sample","value": outOfSampleRows},   # Define out of sample period, rest will be used as in-sample
        "preprocessors": [{
            "type": "CategoryFilter",                                         # Filter only stores on which should be trained
            "value": {
                "column": "Store",
                "categories": inSampleStores
            }            
        }]
    }    
}


build_model_results = tim_client.build_forecasting_model_and_execute(dataset_id, job_configuration)
build_job_id = build_model_results.metadata['id']
resultsTableBuild = build_model_results.table_result
resultsTableBuild.head()


# authorization 
auth_url = TIM_URL+'/auth/login'
auth_response = requests.request(method="POST", url=auth_url, json=tim_credentials).json()
auth_token = auth_response['token']


# predict job configuration
predict_job_configuration = {
    "configuration": {
        "predictionTo": {"baseUnit": "Sample","value": predictionTo},
        "rollingWindow": {"baseUnit": "Sample","value": 1},
    },
    "data": {
        "version": {"id": version_id},
        "outOfSampleRows": {"baseUnit": "Sample","value": outOfSampleRows},
        "preprocessors": [{
            "type": "CategoryFilter",
            "value": {
                "column": "Store",
                "categories": outOfSampleStores
            }            
        }]
    }    
}

# registration of predict job
predict_url = TIM_URL+'/forecast-jobs/'+ build_job_id +'/predict'
predict_register_response = requests.request(method="POST", url=predict_url, headers={'Authorization':'Bearer '+auth_token},json=predict_job_configuration).json()
predict_job_id = predict_register_response['id']


# Execution of job registered with id _predict_job_id_ and waiting for results
predict_response = tim_client.execute_forecast(forecast_job_id = predict_job_id, wait_to_finish = 'true')
resultsTablePredict = predict_response.table_result
resultsTablePredict.head()


colorsOOS  = ['red', 'palevioletred', 'orchid', 'violet']
for i in outOfSampleStores:
    v_data = resultsTablePredict[resultsTablePredict['Store'] == i].sort_values('timestamp')
    production   = v_data['forecast_type'] == 'Production'
    fig = go.Figure(go.Scatter(x=v_data['timestamp'][production], y=v_data['forecast'][production], name='Prediction', line=dict(color='goldenrod')))
    for s in range(1,5):
        outOfSample = (v_data['forecast_type'] == 'OutOfSample') & (v_data['samples_ahead'] == s)
        if s == 1:
            vis = True 
        else:
            vis = 'legendonly' 
        fig.add_trace(go.Scatter(x=v_data['timestamp'][outOfSample], y=v_data['forecast'][outOfSample], name=f'OutOfSample S+{s}', line=dict(color=colorsOOS[s-1]), visible= vis))    
    fig.add_trace(go.Scatter(x=v_data['timestamp'], y=v_data['target'], name='Actuals', line=dict(color='black')))        
    fig.update_layout(height=500, width=1000, title_text=f"Results Store {i}")
    fig.show()


colorsOOS  = ['red', 'palevioletred', 'orchid', 'violet']
colorsIS  = ['green', 'springgreen', 'turquoise', 'limegreen']
for i in inSampleStores[:3]:
    v_data = resultsTableBuild[resultsTableBuild['Store'] == i].sort_values('timestamp')
    production   = v_data['forecast_type'] == 'Production'
    fig = go.Figure(go.Scatter(x=v_data['timestamp'][production], y=v_data['forecast'][production], name='Prediction', line=dict(color='goldenrod')))
    for s in range(1,5):
        outOfSample = (v_data['forecast_type'] == 'OutOfSample') & (v_data['samples_ahead'] == s)
        inSample = (v_data['forecast_type'] == 'InSample') & (v_data['samples_ahead'] == s)
        if s == 1:
            vis = True
        else:
            vis = 'legendonly' 
        fig.add_trace(go.Scatter(x=v_data['timestamp'][outOfSample], y=v_data['forecast'][outOfSample], name=f'OutOfSample S+{s}', line=dict(color=colorsOOS[s-1]), visible= vis))
        fig.add_trace(go.Scatter(x=v_data['timestamp'][inSample], y=v_data['forecast'][inSample], name=f'InSample S+{s}', line=dict(color=colorsIS[s-1]), visible= vis))

    
    fig.add_trace(go.Scatter(x=v_data['timestamp'], y=v_data['target'], name='Actuals', line=dict(color='black')))
    
    
    fig.update_layout(height=500, width=1000, title_text=f"Results Store {i}")
    fig.show()


properties = build_model_results.model_result['model']['Model Zoo']['variableProperties']
properties_df = pd.DataFrame(properties).sort_values(by='importance',ascending=False)
properties_df['rel_importance'] = properties_df['importance']/properties_df.sum()['importance']
fig = px.bar(properties_df, x="name", y="rel_importance", color="name")
fig.update_layout(height=500, width=1000, title_text="Variable Importances")
fig.show()


def find_feature(sub_parts):
    dow_list = ['Monday','Tuesday','Wednesday','Thursday','Friday','Saturday','Sunday']
    features_list = []
    for c,s in enumerate(sub_parts):
        if   s['type']=='β':
            sub_feature = ''
        elif s['type']=='TimeOffsets':
            sub_feature = s['predictor']+'(t'+str(s['offset'])+')'
        elif s['type']=='RestOfWeek':
            sub_feature ='DoW(t'+str(s['offset'])+') <= '+dow_list[s['day']-1]
        elif s['type']=='Intercept':
            sub_feature = 'Intercept('+str(int(s['value']))+')'
        elif s['type']=='Cos':
            sub_feature = 'Cos('+str(int(s['period']))+';'+s['unit']+')'
        elif s['type']=='Sin':
            sub_feature = 'Sin('+str(int(s['period']))+';'+s['unit']+')'
        elif s['type']=='ExponentialMovingAverage':
            sub_feature = 'EMA_'+s['predictor']+'(t'+str(int(s['offset']))+'; w='+str(int(s['window']))+')'
        elif s['type']=='Identity':
            sub_feature = s['predictor']
        elif s['type']=='PiecewiseLinear':
            sub_feature = 'max(0;'+str(s['subtype'])+'*('+str(s['knot'])+'-'+s['predictor']+'(t'+str(s['offset'])+')))'
        elif s['type']=='SimpleMovingAverage':
            sub_feature = 'SMA_'+s['predictor']+'(t'+str(int(s['offset']))+'; w='+str(int(s['window']))+')'
        elif s['type']=='Fourier':
            sub_feature = 'Fourier('+str(s['period'])+')'
        elif s['type']=='Weekday':
            sub_feature = '_test_Weekday_'
        elif s['type']=='Month':
            sub_feature = f"Month({(s['month'])})"
        elif s['type']=='PublicHoliday':
            sub_feature = 'PublicHoliday'
        elif s['type']=='Trend':
            sub_feature = 'Trend'
        else:
            sub_feature = '_test_'
        if s['type']=='β':
            features_list.append(sub_feature)
            beta = s['value']
        else:
            features_list.append(' & '+sub_feature) if c>0 else features_list.append(sub_feature)
    feature_output = ''.join(str(e) for e in features_list)
    return feature_output,beta


features = []
for m in build_model_results.model_result['model']['Model Zoo']['models']:
    terms = m['terms']
    for count,t in enumerate(terms):
        f,b = find_feature(t['parts'])
        features.append([m['index'],count,f,t['importance'],b])

features_df = pd.DataFrame(features,columns=['Model','Term','Feature','importance','beta'])
features_df
fig = px.sunburst(features_df, path=['Model','Feature'], values='importance',color='Feature')
fig.update_layout(height=700,width=700,title_text='Feature Importances')
fig.show()


accuracies = np.zeros((45, 4))
metric = 'mape'
for acc in predict_response.accuracies['groups']['samplesAhead']:
    accuracies[int(acc['groupKeys']) - 1, int(acc['name']) - 1] = acc['outOfSample'][metric]
for acc in build_model_results.accuracies['groups']['samplesAhead']:
    accuracies[int(acc['groupKeys']) - 1, int(acc['name']) - 1] = acc['outOfSample'][metric]

accuracies_df = pd.DataFrame(accuracies, columns=['S+1', 'S+2', 'S+3', 'S+4'])
accuracies_df['Store'] = range(1,46)

for i in [1,2,3,4]:
    fig = px.bar(accuracies_df, x="Store", y=f"S+{i}", color="Store")
    fig.update_layout(height=500, width=900, title_text="Accuracies "+ metric)
    fig.show()


Title:	Store Sales Forecasting
Author:	Maria Starovska, Tangent Works
Industry:	Retail
Area:	Sales
Type:	Forecasting

Column name	Description	Type	Availability
Store	The store number	Group key column
Date	Timestamp	Timestamp column
Weekly_Sales	Binary value indicating if the calendar week contains holiday	Target	t+0
IsHoliday	Indicating if marketing campaign was running, binary values 0 or 1	Predictor	t+4
Temperature	Average temperature in the region	Predictor	t+4
Fuel_Price	Cost of fuel in the region	Predictor	t+4
CPI	The consumer price index	Predictor	t+4
Unemployment	The unemployment rate	Predictor	t+4
Size	Size of store	Predictor	t+4
isA	Binary indicator type of store A	Predictor	t+4
isB	Binary indicator type of store B	Predictor	t+4
isC	Binary indicator type of store C	Predictor	t+4
SpecialHoliday	Binary indicator indicates whether it is week before Christmas and black Friday or normal day	Predictor	t+4

	Store	Date	Weekly_Sales	IsHoliday	Temperature	Fuel_Price	CPI	Unemployment	Size	isA
0	1	2010-01-30	1643690.90	0	42.31	2.572	211.096358	8.106	151315	1
1	1	2010-02-06	1641957.44	1	38.51	2.548	211.242170	8.106	151315	1
2	1	2010-02-13	1611968.17	0	39.93	2.514	211.289143	8.106	151315	1
3	1	2010-02-20	1409727.59	0	46.63	2.561	211.319643	8.106	151315	1
4	1	2010-02-27	1554806.68	0	46.50	2.625	211.350143	8.106	151315	1

	Store	Date	Weekly_Sales	Temperature	Fuel_Price	CPI	Unemployment	Size	isB
6430	45	2012-09-22	713173.95	64.88	3.997	192.013558	8.684	118221	1
6431	45	2012-09-29	NaN	64.89	3.985	192.170412	8.667	118221	1
6432	45	2012-10-06	NaN	54.47	4.000	192.327265	8.667	118221	1
6433	45	2012-10-13	NaN	56.47	3.969	192.330854	8.667	118221	1
6434	45	2012-10-20	NaN	58.85	3.882	192.308899	8.667	118221	1

	Store	timestamp	date_from	time_from	target	forecast	forecast_type	relative_distance	model_index	samples_ahead	lower_bound	upper_bound	bin
0	2	2010-01-30T00:00:00.000Z	2010-01-02	00:00:00.0	2136989.46	NaN	InSample	D+28	NaN	4	NaN	NaN	S+4:S+4
1	2	2010-01-30T00:00:00.000Z	2010-01-09	00:00:00.0	2136989.46	NaN	InSample	D+21	NaN	3	NaN	NaN	S+3:S+3
2	2	2010-01-30T00:00:00.000Z	2010-01-16	00:00:00.0	2136989.46	NaN	InSample	D+14	NaN	2	NaN	NaN	S+2:S+2
3	2	2010-01-30T00:00:00.000Z	2010-01-23	00:00:00.0	2136989.46	NaN	InSample	D+7	NaN	1	NaN	NaN	S+1:S+1
4	2	2010-02-06T00:00:00.000Z	2010-01-09	00:00:00.0	2137809.50	NaN	InSample	D+28	NaN	4	NaN	NaN	S+4:S+4

Demand forecasting in retail - panel data¶

Description¶

Setup¶

Dataset¶

Description¶

Sampling period¶

Data¶

Forecasting situations¶

Source¶

Read and preview dataset¶

Upload dataset to the TIM DB¶

Data visualization¶

Experiment¶

Description¶

Build-model job configuration¶

Build-model job execution¶

Predict job configuration and registration¶

Visualize Results¶

Forecasts Visualization¶

Visualization of stores on which model was not trained¶

Visualisation of stores on which model was trained¶

Importances¶

Variable Importances¶

Feature Importances¶

Accuracies¶

Accuracies per store¶

	Store	timestamp	date_from	time_from	target	forecast	forecast_type	relative_distance	model_index	samples_ahead	lower_bound	upper_bound	bin
0	1	2011-11-19T00:00:00.000Z	2011-10-22	00:00:00.0	2033320.66	2.144742e+06	OutOfSample	D+28	4	4	2.034620e+06	2.272719e+06	S+4:S+4
1	1	2011-11-19T00:00:00.000Z	2011-10-29	00:00:00.0	2033320.66	2.096524e+06	OutOfSample	D+21	3	3	1.990232e+06	2.214860e+06	S+3:S+3
2	1	2011-11-19T00:00:00.000Z	2011-11-05	00:00:00.0	2033320.66	2.226591e+06	OutOfSample	D+14	2	2	2.127554e+06	2.336409e+06	S+2:S+2
3	1	2011-11-19T00:00:00.000Z	2011-11-12	00:00:00.0	2033320.66	2.258263e+06	OutOfSample	D+7	1	1	2.161485e+06	2.371231e+06	S+1:S+1
4	1	2011-11-26T00:00:00.000Z	2011-10-29	00:00:00.0	1584083.95	1.888743e+06	OutOfSample	D+28	4	4	1.778621e+06	2.016720e+06	S+4:S+4