#bigdata #datascience #datavisualization #unitedconsult

Kereslet előrejelzés idősor elemzésen alapuló módszerekkel

A kereslet előrejelzés elengedhetetlen tervezési lépés a cégek optimális működéséhez. Ha a szervezeteknek van megfelelő becslésük arról, hogy hogyan fognak alakulni az eladásaik, akkor számos folyamatot a beszerzéstől a gyártásig könnyebben és költséghatékonyan tudnak tervezni.

Az előrejelzésekhez sokszor nem áll rendelkezésre semmilyen külső információ, semmilyen adat a jövőre vonatkozóan, csak az adott idősor. Ez esetben a statisztikai módszerekhez tudunk nyúlni.

Az idősorok időben egymás utáni megfigyelések sorozata. A tipikus példa idősorokra : energetika, pénzügy, kereskedelem területén előálló adatok, mint például a havi áramfogyasztás alakulása Magyarországon:

Mivel az idősorok egymás utáni értékei erősen korrelálnak, a múltbeli értékek alapján előre tudjuk jelezni a sorozat következő elemeit statisztikai módszerek segítségével.

Ahhoz hogy előre jelezzük Az idősor soron következő értékeit, először is meg kell értenünk a múltbeli mozgásokat. Az idősorok mintázatai különböző hatások együttes eredménye. Az idősorok változásai felbonthatóak az alábbi összetevőkre:

  • Trendhatásra: A hosszú távú irány, trendvonal
  • Szezonalitásra: Visszatérő hasonló hatású jelenségek (pl. hosszú hétvége, ünnepek)
  • ciklikus hatásra: Hosszú távú ingadozások a trendvonal körül
  • és zajra: nem magyarázható random mozgások

Idősor előrejelzése ARIMA modellekkel

Az ARIMA Modellek két fő komponense az AR és MA modell, ezeket ötvözi. Az AR modell, az idősor aktuális értékeit a saját azt megelőző értékeinek függvényében fejezi ki. Stacionárius idősorokon alkalmazható, azaz olyan idősorokon, amelyeknek a várható értéke és szórása az idősoron belül állandó. Ilyen idősor például egy EKG adat. A legtöbb idősor nem stacionárius, ezért transzformálni kell őket, hogy eltávolítsuk belőlük a trend és a szezonális hatásokat.

Ilyen transzformáció lehet például ha differenciáljuk, amikor is minden értékből kivonjuk az azt megelőző értéket. Ezt az új transzformált idősort nevezzük differenciált idősornak. Ha még ez se stacionárius, akkor a műveletet újra el kell végeznünk. Más módszer lehet még a transzformálásra többek között a logaritmizálás vagy a százalékos változás számítása.

Az MA (mooving average) modell az idősor értékeit a múltbeli véletlen változók függvényében fejezi ki, ehhez eszköze a mozgóátlag. Alkalmazása számításba veszi a ciklikusság szezonalitás és zaj hatását.

ARIMA modell ezek ötvözete. Három fő paramétere van, az első az AR modellre vonatkozik, a második adja meg, hogy hányszor kell differenciálni az idősort, hogy stacionárius legyen. A harmadik paraméter pedig a mozgóátlagra vonatkozóan ad információt, hogy hány egységet vegyen figyelembe.

Ahogy a fenti ábrán is láthatjuk, egészen megfelelő becslésre képes ez a megoldás. Azonban azt fontos tudni, hogy a legtöbb idősor nem ennyire jól előre jelezhető tisztán statisztikai megközelítéssel.

Kereslet előrejelzés adatbányászati módszerekkel

Sok idősornál a sorozat alakulására vannak jól beazonosítható külső tényezők, más idősor adatok,  melyek jól felhasználhatóak az előrejelzés készítéséhez. Ebben az eseten az idősorunk lesz a célváltozó, más idősorok pedig a magyarázóváltozók. Például az előző példánál maradva, ha az energia felhasználásra hatással van a hőmérséklet, csapadék, szél, akkor az időjárás előrejelzés adatai hatékonyan felhasználhatóak az energia fogyasztás megbecsüléséhez. Lényegében az ARIMA megközelítés is hasonló, azonban ott a „más idősorok” azok ugyanannak az idősornak a késleltetett változatai. Külső magyarázó változók bevonása nagyban javíthatja az előrejelzés pontosságát, és egyben üzleti hasznát.

Egy idősor előrejelzése adatbányászati módszerrel regressziós feladat. Számos algoritmus áll rendelkezésre amelyekkel ezt a problémát meg tudjuk oldani. A folyamat az alábbiak szerint zajlik:

A szürke változók a magyarázó változók melyek ismeretében a zöld célváltozót szeretnénk megbecsülni. Az eredmény szempontjából a legfontosabb feladat a megfelelő magyarázó változók bevonása. A munka legnagyobb része az adathalmazaink megismerése, más, releváns adatok bevonása a magyarázó változók közé.

A fenti példánál maradva a dátumból is több következtetést levonhatunk, bevezethetünk új számított változókat, mint például, a hónap, hónap hányadik napja, hétvége e vagy sem, vagy ünnepnap.

A forgalomra vonatkozóan is célszerű új változókat bevezetni, az előző fejezet tanulságait felhasználva: az egy héttel ezelőtti forgalom, 2 héttel ezelőtti forgalom, 3 héttel ezelőtti forgalom fontos változó lehet. Hasznos lehet az 1 hetes átlagforgalom, elmúlt x hét átlagforgalma is a modell pontosságát javítani.

Az időjárásra vonatkozó információt is érdemes elemezni, például a havi átlaghőmérséklettől való eltérés, vagy a hőmérsékletváltozás, mint változó bevezetése valószínűleg több információtartalommal bír, mint pusztán a hőmérséklet fokban.

Új, jó, a célváltozóval kapcsolatban lévő magyarázó változok bevonása jelentősen tudja javítani a modellünket, és azon keresztül az előrejelzés pontosságát.

Az adatbányászati megközelítés nagy előnye, hogy megfelelő magyarázóváltozókkal sok különböző idősor is előre jelezhető egyetlen modellel. Például ha egy kereskedelmi üzletlánc bolt szintű forgalmát szeretnénk előre jelezni, akkor, ha ezt idősoros megközelítéssel szeretnénk megvalósítani, boltonként egy modellre lenne szükség. Minden bolt forgalma egy különálló idősor. Regressziós feladatként pedig egy modell is elegendő, amit a különböző boltok idősorait egy adathalmazként kezelve tanítunk be. Így az egyes boltok adatai plusz információt szolgáltatnak a modellnek más boltokhoz való előrejelzéshez is, tehát a modell potenciálisan még jobb lehet, mintha minden boltra külön modellt fejlesztenénk.

Contact Form

Megvalósíthatósági ajánlat

Az adataidban rejlő üzleti pontenciál bizonyára hatalmas, de minden fejlesztés és újítás egyben kockázatot is rejt magában.

Tisztában vagyunk azzal, hogy minden üzleti igény, így egy adatokra épülő webshop funkció fejlesztése más és más. Ahhoz, hogy egy ilyen fejlesztés sikeres legyen és üzleti értéket teremtsen a vállalkozásod számára, elengedhetetlen, hogy tisztán lássuk a lehetőségeket és kockázatokat.

A sikeres együttműködés megalapozása érdekében kialakítottunk egy  megvalósíthatósági csomag ajánlatot, amely keretében nem lesz más teendőd, mint elmondani az üzleti igényed és rendelkezésre bocsájtani a minimálisan szükséges adatokat, a továbbiakat pedig az adatbányász csapatunkra bízni.

Az ajánlat keretében felmérjük az adataidban rejlő ponteciált, javaslatot teszünk az igényekre illeszkedő funkciók fejlesztési ütemére, volumenére, valamint feltárjuk a fejlesztéssel kapcsolatos kockázatokat is.