پیش بینی قیمت بیت کوین با استفاده از پیش بینی سری زمانی

ساخت وبلاگ

1. وابسته به زمان است. بنابراین ، فرض اساسی یک مدل رگرسیون خطی که مشاهدات مستقل در این مورد نیستند.

2. در کنار یک روند روزافزون یا در حال کاهش ، بیشتر سری های زمانی نوعی روند فصلی دارند ، یعنی تغییرات خاص برای یک بازه زمانی خاص.

بنابراین از مدل های یادگیری ماشین ساده نمی توان استفاده کرد و از این رو پیش بینی سری زمانی زمینه دیگری از تحقیق است. در این مقاله از مدل های سری زمانی مانند AR (مدل رگرسیون خودکار) ، MA (مدل متوسط در حال حرکت) و ARIMA (مدل میانگین متحرک یکپارچه Autoregressive) برای پیش بینی قیمت بیت کوین استفاده می شود.

این مجموعه داده شامل قیمت های افتتاحیه و بسته شدن بیت کوین از آوریل 2013 تا آگوست 2017 است

وارد کردن کتابخانه های لازم

داده ها از یک فایل CSV در Train DataFrame بارگذاری می شوند. به این ترتیب پنج ردیف اول داده های ما به نظر می رسد.

ترسیم سریال های زمانی

با استفاده از تاریخ به عنوان فهرست ، این سریال با تاریخ در محور x و قیمت بسته شدن در محور Y ترسیم شده است.

آزمایش ثابت بودن

آزمون افزودنی دیکی فولر:

آزمون افزودنی دیکی فولر نوعی تست آماری به نام تست ریشه واحد است.

شهود پشت یک تست ریشه واحد این است که تعیین می کند که یک سری زمانی به شدت با یک روند تعریف می شود.

وجود ندارد. تست های ریشه واحد و ADF یکی از پرکاربردترین است

1. فرضیه تهی (H0): فرضیه تهی از آزمون این است که سری زمانی را می توان با ریشه واحد نشان داد که ثابت نیست.

2. فرضیه جایگزین (H1): فرضیه جایگزین آزمون این است که سری زمانی ثابت است.

تفسیر ارزش p

1. p value >0. 05: فرضیه تهی (H0) را می پذیرد ، داده ها دارای ریشه واحد هستند و غیر ثابت است.

از آنجا که مقدار p از 0. 05 بیشتر است ، سری زمانی غیر ثابت است. خوب تا کنون ما این سریال را آزمایش کردیم و غیر ثابت است. بنابراین کارهایی وجود دارد که باید در اینجا انجام شود. بنابراین اکنون ما از تحولات استفاده می کنیم تا این سریال ثابت شود.

ورود به سیستم سریال

از تحول ورود به سیستم برای استفاده از داده های بسیار ناچیز استفاده می شود. بنابراین به روند پیش بینی کمک می کند.

این سریال هنوز ثابت نیست زیرا مقدار P هنوز از 0. 05 بیشتر است ، بنابراین ما باید تحولات بیشتری انجام دهیم. بنابراین بیایید با تفاوت پیش برویم.

روند و فصلی را با تفاوت حذف کنید

در صورت تفاوت برای ایجاد سری زمانی ثابت ، مقدار فعلی با مقادیر قبلی کم می شود. به همین دلیل میانگین تثبیت می شود و از این رو شانس ثابت بودن سری زمانی افزایش می یابد.

از آنجا که سری زمانی ما اکنون مقدار ASOUR P ثابت کمتر از 0. 05 است ، بنابراین می توانیم مدل های پیش بینی سری زمانی را اعمال کنیم.

مدل رگرسیون خودکار

مدل رگرسیون خودکار یک مدل پیش بینی سری زمانی است که مقادیر فعلی به مقادیر گذشته وابسته است.

در حال حرکت مدل متوسط

در مدل متوسط در حال حرکت ، این سریال به اصطلاحات خطای گذشته بستگی دارد.

مدل متوسط متحرک یکپارچه رگرسیون خودکار

این ترکیبی از مدل های AR و MA است. این مجموعه زمانی را به خودی خود از طریق فرآیند متفاوت بودن ثابت می کند. بنابراین برای مدل ARIMA به صراحت لازم نیست

بنابراین می بینیم که خطای RSS (جمع باقیمانده مربع) برای مدل ARIMA حداقل است. بنابراین مدل ARIMA به دلیل استفاده از وابستگی به مقادیر عقب مانده و شرایط خطا در بین این سه مدل بهترین است. بنابراین بیشتر برای محاسبه خطای میانگین مربع استفاده می شود. در اینجا در قطعه کد زیر مجموعه داده به قطار و تست تقسیم می شود.

برای هر مقدار در آزمون آزمون ما یک مدل ARIMA را اعمال می کنیم و سپس خطا محاسبه می شود و بعد از تکرار بیش از تمام مقادیر موجود در آزمون ، میانگین خطای بین مقدار پیش بینی شده و مورد انتظار محاسبه می شود.

پیش بینی شده = 2513. 745189 ، انتظار می رود = 2564. 060000 ، خطا = 1. 962310 ٪ پیشینه = 2566. 007269 ، مورد انتظار = 2601. 640000 ، خطای = 1. 369626 ، پیش بینی = 2604. 348629 ، انتظار = 2601. 990000 ، error = 0. 090000 ،2613. 835793 ، انتظار می رود = 2518. 660000 ، خطا = 3. 778827 ٪ پیش بینی شده = 2523. 203681 ، انتظار می رود = 2571. 340000 ، خطا = 1. 872032 = 2322220222022202220 ، انتظار می رود = 2518. 440000 ، خطا = 2. 470376 ٪انتظار می رود = 2337. 790000 ، خطا = 1. 765635 ٪ پیش بینی شده = 2348. 468544 ، انتظار می رود = 2398. 840000 ، خطا = 2. 099826 ٪ پیش بینی شده = 2405. 2999995 ، پیش بینی = 2357. 900000 ، خطا = 2. 010263 ٪ پیش بینی = 2359. 65035 ،1998. 860000 ، خطا = 12. 013960 ٪ پیش بینی = 2006. 206534 ، انتظار می رود = 1929. 820000 ، خطا = 3. 958221 ٪ پیش بینی شده = 1942. 244784 ، انتظار می رود = 2228. 410000 ، خطا = 12. 841677 ٪ پیش بینی شده = 2238. 150016 ، انتظار می رود = 2318. 880000 ، خطا = 3. 481421 ٪ پیش بینی شده = 2307. 325788 ، پیش بینی = 2273. 430000 ، خطا = 1. 490954 ٪ پیش بینی شده = 2272. 890197 ، مورد انتظارخطا = 6. 045944 ٪ پیش بینی شده = 2646. 110662 ، انتظار می رود = 2810. 120000 ، خطا = 5. 836382 ٪ پیش بینی شده = 2822. 356853 ، انتظار = 2730. 400000 ، خطا = 3. 36789 ٪ پیش بینی = 2730. 087031 ، انتظار می رود = 2754. 860000 ، خطا7. 269072 ٪ پیش بینی شده = 2580. 946838 ، انتظار می رود = 2529. 450000 ، خطا = 2. 035891 ٪ پیش بینی شده = 2541. 493507 ، انتظار = 2671. 78000000 ، خطا = 4. 876393 ٪ = 2679. 029936 ، پیش بینی = 280909010000 ، خطاپیش بینی شده = 2726. 150588 ، انتظار می رود = 2757. 180000 ، خطا = 1. 125404 ٪ پیش بینی شده = 2766. 298163 ، انتظار می رود = 2875. 340000 ، خطا = 3. 792311 ٪

میانگین خطای در پیش بینی مقالات مورد آزمایش: 3. 593133 ٪

بنابراین سری زمانی اصلی و پیش بینی شده با میانگین خطای 3. 59 ٪ ترسیم شده است. از این رو ما قادر به استفاده از تحولات و مدل های مختلف برای پیش بینی قیمت بسته شدن بیت کوین بودیم.

با تشکر از شما اگر تا آخرین خوانده اید. این اولین مقاله من در مورد علوم داده است و چیزهای دیگری نیز وجود دارد. اگر اشتباهی پیدا کردید یا پیشنهادی دارید ، لطفاً نظر دهید. اگر پست را دوست داشتید ، لطفاً فراموش نکنید که چنگ بزنید! متشکرم.

سیگنالهای معاملاتی...
ما را در سایت سیگنالهای معاملاتی دنبال می کنید

برچسب : نویسنده : عارف لرستانی بازدید : 46 تاريخ : پنجشنبه 10 فروردين 1402 ساعت: 15:35