Wednesday 30 August 2017

Data rata rata terpusat untuk bulanan


Ketika menghitung rata-rata bergerak yang berjalan, rata-rata menempatkan pada periode paruh waktu masuk akal. Pada contoh sebelumnya, kami menghitung rata-rata periode 3 periode pertama dan menempatkannya di samping periode 3. Kami dapat menempatkan rata-rata di tengah Interval waktu tiga periode, yaitu, di samping periode 2. Ini berjalan dengan baik dengan periode waktu yang aneh, tapi tidak begitu baik bahkan untuk periode waktu tertentu. Jadi, di mana kita akan menempatkan moving average pertama ketika M4 secara teknis, Moving Average akan turun pada t 2,5, 3,5. Untuk menghindari masalah ini, kita menyelesaikan MA dengan menggunakan M 2. Dengan demikian, kita menghaluskan nilai yang merapikan Jika kita menghitung jumlah rata-rata, kita perlu menghaluskan nilai yang merapikan Tabel berikut menunjukkan hasil menggunakan M 4.Predictive Analytics dengan Microsoft Excel: Bekerja dengan Seri Waktu Musiman Dalam Bab Ini Rata-rata Rata-rata Musiman Rata-rata Bergerak dan Rata-rata Bergerak Rata-Rata Beralih Regresi Linier dengan Vektor KODE Pemodelan Eksponensial Eksponensial Musim Dingin yang Tepat Pemrograman Eksponen secara perlahan lebih rumit bila Anda memiliki rangkaian waktu yang dicirikan sebagian oleh musiman: kecenderungan Dari levelnya naik dan turun sesuai dengan berlalunya musim. Kami menggunakan istilah musim dalam arti yang lebih umum daripada makna sehari-harinya di tahun8217 empat musim. Dalam konteks analisis prediktif, satu musim bisa menjadi satu hari jika pola diulang setiap minggu, atau satu tahun dalam hal siklus pemilihan presiden, atau hampir di antara keduanya. Pergeseran delapan jam di rumah sakit bisa mewakili satu musim. Bab ini membahas bagaimana menguraikan deret waktu sehingga Anda dapat melihat bagaimana musimannya beroperasi terlepas dari trennya (jika ada). Seperti yang Anda harapkan dari materi dalam Bab 3 dan 4, beberapa pendekatan tersedia untuk Anda. Rata-rata Musiman Sederhana Penggunaan rata-rata musiman sederhana untuk model rangkaian waktu terkadang memberi Anda model data yang cukup kasar. Namun pendekatan ini memperhatikan musim di kumpulan data, dan teknik ini mudah dikenali dengan lebih akurat daripada teknik peramalan eksponensial sederhana saat musim hujan diucapkan. Tentu ini berfungsi sebagai pengantar yang berguna untuk beberapa prosedur yang digunakan dengan deret waktu yang bersifat musiman dan cenderung tren, jadi lihatlah contoh pada Gambar 5.1. Gambar 5.1 Dengan model horizontal, hasil rata-rata sederhana menghasilkan ramalan yang tidak lebih dari sekadar sarana musiman. Data dan grafik yang ditunjukkan pada Gambar 5.1 mewakili jumlah rata-rata hit harian ke situs web yang melayani penggemar National Football League. Setiap pengamatan di kolom D menunjukkan jumlah rata-rata hit per hari di masing-masing empat perempat dalam rentang waktu lima tahun. Mengidentifikasi Pola Musiman Anda bisa tahu dari rata-rata di kisaran G2: G5 bahwa efek kuartalan yang berbeda sedang terjadi. Jumlah rata-rata hit terbesar terjadi saat musim gugur dan musim dingin, saat 16 pertandingan utama dan playoff dijadwalkan. Bunga, yang diukur dengan hit harian rata-rata, menurun selama musim semi dan musim panas. Rata-rata mudah untuk menghitung apakah Anda merasa nyaman dengan formula array atau tidak. Untuk mendapatkan rata-rata dari kelima kasus Quarter 1, misalnya, Anda dapat menggunakan formula array ini di sel G2 pada Gambar 5.1: Array-masukkan dengan CtrlShiftEnter. Atau Anda dapat menggunakan fungsi AVERAGEIF (), yang dapat Anda masukkan dengan cara biasa, menekan tombol Enter. Secara umum, saya lebih memilih pendekatan rumus array karena memberi saya ruang lingkup untuk kontrol yang lebih besar atas fungsi dan kriteria yang terlibat. Seri data yang dipetakan mencakup label data yang menunjukkan kuota masing-masing titik data. Bagan tersebut menggemakan pesan rata-rata di G2: G5: Perempat 1 dan 4 berulang kali mendapat banyak klik. Ada musim yang jelas di set data ini. Menghitung Indeks Musiman Setelah Anda memutuskan bahwa deret waktu memiliki komponen musiman, Anda ingin mengukur ukuran efeknya. Rata-rata yang ditunjukkan pada Gambar 5.2 menunjukkan bagaimana metode rata-rata sederhana berjalan mengenai tugas itu. Gambar 5.2 Kombinasikan mean grand dengan rata-rata musiman untuk mendapatkan indeks musiman. Pada Gambar 5.2. Anda mendapatkan indeks musiman tambahan di kisaran G10: G13 dengan mengurangi mean grand di sel G7 dari setiap rata-rata musiman di G2: G5. Hasilnya adalah 8220effect8221 berada di Quarter 1, berada di Quarter 2, dan seterusnya. Jika bulan yang ditentukan ada di Quarter 1, Anda memperkirakan jumlah klik harian rata-rata lebih tinggi dari rata-rata 99,65 dari rata-rata 140,35 klik per hari. Informasi ini memberi Anda rasa betapa pentingnya berada di musim yang ditentukan. Misalkan Anda memiliki situs web yang dimaksud dan Anda ingin menjual ruang iklan di atasnya. Anda pasti bisa meminta harga pengiklan yang lebih tinggi selama kuartal pertama dan keempat daripada pada periode kedua dan ketiga. Lebih tepatnya, Anda mungkin bisa melakukan pembayaran dua kali lipat selama kuartal pertama dibandingkan pada periode kedua atau ketiga. Dengan indeks musiman di tangan, Anda juga bisa menghitung penyesuaian musiman. Misalnya, masih pada Gambar 5.2. Nilai penyesuaian musiman untuk setiap kuartal di tahun 2005 muncul di G16: G19. Mereka dihitung dengan mengurangkan indeks dari pengukuran kuartalan yang terkait. Secara tradisional, istilah indeks musiman mengacu pada kenaikan atau penurunan tingkat seri yang terkait dengan setiap musim. Istilah musiman identik efek telah muncul dalam literatur dalam beberapa tahun terakhir. Karena Anda akan melihat kedua istilah itu, saya menggunakan keduanya dalam buku ini. Ini adalah masalah kecil yang perlu diingat bahwa kedua istilah memiliki arti yang sama. Perhatikan bahwa dalam kejadian normal dari tahun 2001 sampai 2005, Anda memperkirakan hasil kuartal kedua8217s tertinggal dari hasil kuartal pertama 2.717s dengan 133,6 (yaitu, 99,65 dikurangi 821133.95). Namun di tahun 2004 dan 2005, hasil penyesuaian musiman untuk kuartal kedua melebihi angka pada kuartal pertama. Hasil itu mungkin akan meminta Anda untuk menanyakan apa yang telah berubah dalam dua tahun terakhir yang membalikkan hubungan antara hasil penyesuaian musiman untuk dua kuartal pertama. (Saya tidak dapat mengemukakan masalah itu di sini. Saya mengemukakannya untuk menyarankan agar Anda sering melihat-lihat gambar yang teramati dan disesuaikan musiman). Peramalan dari Rata-Rata Rata-Rata Musiman: Tidak Ada Trend Meskipun metode rata-rata sederhana adalah seperti yang saya katakan Lebih jauh lagi, ini bisa jauh lebih akurat daripada alternatif pemulusan eksponensial yang lebih canggih, terutama bila efek musiman diucapkan dan dapat diandalkan. Bila deret waktu tidak tersentuh, seperti contoh contoh yang telah dibahas dalam bagian ini, perkiraan musiman sederhana tidak lebih dari rata-rata musiman. Bila seri tidak tren naik atau turun, perkiraan terbaik Anda untuk nilai musim depan adalah rata-rata historis season8217. Lihat Gambar 5.3. Gambar 5.3 Kombinasikan mean grand dengan rata-rata musiman untuk mendapatkan indeks musiman. Pada bagan pada Gambar 5.3. Garis putus-putus mewakili ramalan dari perataan sederhana. Dua garis padat mewakili pengamatan musiman aktual dan rata-rata musiman. Perhatikan bahwa rata-rata musiman melacak pengamatan musiman yang sebenarnya cukup dekat dibandingkan dengan perkiraan merapikannya. Anda dapat melihat seberapa jauh jaraknya dari dua RMSE dalam sel F23 dan H23. RMSE untuk rata-rata musiman hanya sedikit lebih dari sepertiga RMSE untuk ramalan yang dihaluskan. Anda dapat menghitungnya sampai seukuran efek musiman dan juga konsistensi mereka: Misalnya, misalnya, perbedaan antara rata-rata kuartal pertama dan kedua adalah 35,0 dan bukan 133,6 (yang merupakan perbedaan antara sel G2 dan G3 pada Gambar 5.2). Kemudian, dalam konteks smoothing, nilai sebenarnya untuk Quarter 1 akan menjadi prediktor nilai Triwulan 2 yang jauh lebih baik daripada yang ada pada seri waktu ini. Dan perataan eksponensial dapat sangat bergantung pada nilai pengamatan saat ini untuk perkiraan periode berikutnya. Jika konstanta smoothing ditetapkan pada 1.0, eksponensial smoothing memutuskan untuk memperkirakan secara neto dan perkiraan selalu sama dengan sebelumnya. Fakta bahwa ukuran setiap ayunan musiman sangat konsisten dari kuartal ke kuartal berarti rata-rata musiman sederhana adalah perkiraan yang dapat dipercaya: Tidak ada pengamatan kuartalan aktual yang berangkat sangat jauh dari keseluruhan rata-rata musiman. Rata-rata Rata-rata Rata-Rata dengan Trend Penggunaan rata-rata musiman sederhana dengan rangkaian yang trending memiliki beberapa kekurangan nyata, dan I8217m tergoda untuk menyarankan agar kita mengabaikannya dan beralih ke topik yang lebih baik. Tapi mungkin Anda akan mengalami situasi di mana seseorang telah menggunakan metode ini dan kemudian tidak salah bila mengetahui bagaimana cara kerjanya dan mengapa ada pilihan yang lebih baik. Setiap metode untuk menangani seasonality dalam rangkaian yang dilontarkan harus menghadapi masalah mendasar dalam menguraikan efek dari tren musiman. Musiman cenderung tidak jelas, dan sebaliknya. Lihat Gambar 5.4. Gambar 5.4 Kehadiran tren mempersulit perhitungan efek musiman. Fakta bahwa tren dalam rangkaian ini naik dari waktu ke waktu berarti bahwa hanya rata-rata setiap pengamatan season8217, seperti yang dilakukan dalam kasus tanpa tren, mengacaukan tren umum dengan variasi musiman. Ide yang biasa adalah menjelaskan tren secara terpisah dari efek musiman. Anda bisa mengukur tren dan mengurangi pengaruhnya dari data yang diobservasi. Hasilnya adalah rangkaian untrended yang mempertahankan variasi musiman. Hal itu bisa ditangani dengan cara yang sama seperti yang saya gambarkan sebelumnya di bab ini. Menghitung Mean untuk Setiap Tahun Salah satu cara untuk detrend data (dan cara lain pasti akan terjadi pada Anda) adalah menghitung tren berdasarkan rata-rata tahunan daripada data kuartalan. Idenya adalah rata-rata tahunan tidak sensitif terhadap efek musiman. Artinya, jika Anda mengurangi nilai rata-rata tahun ke tahun dari nilai untuk masing-masing perempatnya, jumlah (dan rata-rata) dari empat efek kuartalan adalah nol. Jadi, tren yang dihitung dengan menggunakan rata-rata tahunan tidak terpengaruh oleh variasi musiman. Perhitungan ini muncul pada Gambar 5.5. Gambar 5.5 Metode ini sekarang menerapkan regresi linier pada rata-rata sederhana. Langkah pertama dalam detrending data adalah mendapatkan rata-rata hit harian setiap tahunnya. Itu dilakukan pada kisaran H3: H7 pada Gambar 5.5. Rumus di sel H3, misalnya, adalah RATA-RATA (D3: D6). Menghitung Trend Berdasarkan Sarana Tahunan Dengan rata-rata tahunan di tangan, Anda berada dalam posisi untuk menghitung tren mereka. That8217s dikelola dengan menggunakan LINEST () di kisaran I3: J7, dengan menggunakan rumus array ini: Jika Anda tidak memberikan nilai x sebagai argumen kedua ke LINEST (). Excel menyediakan nilai x default untuk Anda. Defaultnya hanyalah bilangan bulat berurutan yang dimulai dengan 1 dan diakhiri dengan jumlah nilai y yang Anda panggil dalam argumen pertama. Dalam contoh ini, nilai x default sama dengan yang ditentukan pada lembar kerja di G3: G7, jadi Anda bisa menggunakan LINEST (H3: H7. TRUE). Rumus ini menggunakan dua default, untuk nilai-x dan konstanta, yang ditunjukkan oleh tiga koma berturut-turut. Inti dari latihan ini adalah mengukur tren dari tahun ke tahun, dan LINEST () melakukannya untuk Anda di sel I3. Sel itu mengandung koefisien regresi untuk nilai-x. Kalikan 106,08 dengan 1 maka dengan 2 maka dengan 3, 4, dan 5 dan tambahkan ke setiap hasil intercept dari 84,63. Meskipun itu membuat Anda memperkirakan tahunan, poin penting untuk prosedur ini adalah nilai koefisien 106,08, yang mengukur tren tahunan. Langkah yang baru saja saya diskusikan adalah sumber keraguan saya tentang keseluruhan pendekatan yang digambarkan oleh bagian ini. Anda biasanya memiliki sejumlah kecil periode yang melingkupi dalam contoh ini, tahun8282 untuk menjalankan regresi. Hasil regresi sering kali tidak stabil saat, seperti di sini, mereka didasarkan pada sejumlah kecil pengamatan. Namun, prosedur ini bergantung pada hasil-hasil itu dengan berat untuk mengurangi deret waktu. Merancang Tren Sepanjang Musim Metode rata-rata sederhana untuk menghadapi seri musiman yang tertunda seperti yang satu ini terus berlanjut dengan membagi tren dengan jumlah periode dalam periode yang mencakup untuk mendapatkan tren per periode. Di sini, jumlah periode per tahun adalah empat8212we8217 bekerja dengan data triwulanan8212 jadi kita membagi 106,08 menjadi 4 untuk memperkirakan tren per kuartal di 26,5. Prosedur menggunakan tren periodik dengan mengurangkannya dari hasil periodik rata-rata. Tujuannya adalah untuk menghapus efek tren tahunan dari efek musiman. Pertama, kita perlu menghitung hasil rata-rata sepanjang lima tahun untuk Periode 1, untuk Periode 2 dan seterusnya. Untuk melakukan itu, ada baiknya mengatur ulang daftar klik kuartalan aktual, yang ditunjukkan pada kisaran D3: D22 pada Gambar 5.5. Ke dalam matriks lima tahun empat perempat, ditunjukkan pada kisaran G11: J15. Perhatikan bahwa nilai-nilai dalam matriks tersebut sesuai dengan daftar di kolom D. Dengan data yang disusun dengan cara itu, mudah untuk menghitung nilai kuartalan rata-rata selama lima tahun dalam kumpulan data. Itu dilakukan pada kisaran G18: J18. Efek dari tren yang dikembalikan oleh LINEST () muncul di kisaran G19: J19. Nilai awal untuk setiap tahun adalah rata-rata hit harian yang diamati untuk kuartal pertama, jadi kami tidak melakukan penyesuaian untuk kuartal pertama. Tren seperempat8217s, atau 26,5, dikurangi dari angka rata-rata kuartal kedua8217, yang menghasilkan nilai kuartal kedua yang disesuaikan 329,9 (lihat sel H21, Gambar 5.5). Tren dua quarters8217, 2 215 26,5 atau 53 pada sel I19, dikurangkan dari kuartal ketiga tahun 1982 yang berarti untuk mendapatkan nilai kuartal ketiga yang disesuaikan sebesar 282,6 pada sel I21. Dan juga untuk kuartal keempat, mengurangi tiga perempat tren dari 454,4 untuk mendapatkan 374,8 di sel J21. Ingatlah bahwa jika tren turun dan bukan naik, seperti dalam contoh ini, Anda akan menambahkan nilai tren periodik ke mean periodik yang diamati alih-alih mengurangkannya. Mengubah Sarana Musiman yang Disesuaikan dengan Efek Musiman Per logika metode ini, nilai yang ditunjukkan pada baris 20821121 pada Gambar 5.5 adalah hasil kuartalan rata-rata untuk masing-masing empat perempat, dengan efek kecenderungan kenaikan umum pada kumpulan data yang dihapus. (Baris 20 dan 21 digabungkan dalam kolom G sampai J.) Dengan kecenderungan mereka, kita dapat mengubah angka tersebut menjadi perkiraan efek musiman. Hasil di kuartal pertama, di kuarter kedua, dan seterusnya. Untuk mendapatkan efek tersebut, mulailah dengan menghitung mean rata-rata dari mean kuartalan yang disesuaikan. Itu berarti grand yang disesuaikan muncul di sel I23. Analisis berlanjut pada Gambar 5.6. Gambar 5.6 Efek kuartalan, atau indeks, digunakan untuk mendokumentasikan kuartalan yang diamati. Gambar 5.6 mengulang penyesuaian kuartalan dan mean grand yang disesuaikan dari bagian bawah Gambar 5.5. Mereka digabungkan untuk menentukan indeks kuartalan (yang juga dapat Anda anggap sebagai efek musiman). Misalnya, rumus di sel D8 adalah sebagai berikut: Ia mengembalikan 821133.2. Itu adalah efek dari pada kuartal kedua, vis-224-vis grand mean: Sehubungan dengan grand mean, kita bisa mengharapkan hasil yang termasuk pada kuartal kedua turun di bawah grand mean sebesar 33,2 unit. Menerapkan Efek musiman pada Triwulan yang Teramati Untuk rekap: Sejauh ini, kami mengukur tren tahunan data melalui regresi dan membagi kecenderungan itu dengan 4 untuk mengembalikannya ke nilai kuartalan. Mengambil pada Gambar 5.6. Kami menyesuaikan rata-rata untuk setiap kuartal (dalam C3: F3) dengan mengurangi tren prorata di C4: F4. Hasilnya adalah perkiraan rata-rata untuk setiap kuartal, terlepas dari tahun di mana kuartal berlangsung, di C5: F5. Kami mengurangi mean grand yang disesuaikan, di sel G5, dari mean kuartalan yang disesuaikan di C5: F5. Yang mengubah setiap quarter8217s berarti ukuran efek setiap triwulan relatif terhadap mean grand yang disesuaikan. Itu adalah indeks musiman atau efek di C8: F8. Selanjutnya kita menghilangkan efek musiman dari kuartalan yang diamati. Seperti ditunjukkan pada Gambar 5.6. Anda melakukannya dengan mengurangi indeks kuartalan di C8: F8 dari nilai yang sesuai di C12: F16. Dan cara termudah untuk melakukannya adalah dengan memasukkan formula ini ke dalam sel C20: Perhatikan tanda satu dolar sebelum 8 di referensi ke C8. Itu adalah referensi campuran: sebagian relatif dan sebagian absolut. Tanda dolar jangkar menunjuk pada baris kedelapan, namun bagian kolom referensi bebas untuk bervariasi. Oleh karena itu, setelah formula yang terakhir dimasukkan ke dalam sel C20, Anda bisa mengklik pegangan seleksi cell8217s (kotak kecil di sudut kanan bawah sel yang dipilih) dan seret ke sel F20. Alamat menyesuaikan saat Anda menyeret ke kanan dan Anda mengakhiri nilai, dengan efek musiman dihapus, untuk tahun 2001 di C20: F20. Pilih rentang empat sel itu dan gunakan pegangan multiple selection8217s, sekarang di F20, untuk menarik ke bawah ke baris 24. Jadi, lakukan pengisian sisa matriks. Hal penting yang perlu diingat di sini adalah bahwa kita menyesuaikan nilai kuartalan asli untuk efek musiman. Tren apa pun yang ada di nilai aslinya masih ada, dan teori ini, setidaknya ada di sana setelah kita melakukan penyesuaian untuk efek musiman. Kami telah menghilangkan tren, ya, tapi hanya dari efek musiman. Jadi, bila kita mengurangi efek musiman (detrended) dari pengamatan kuartalan awal, hasilnya adalah pengamatan asli dengan kecenderungan namun tanpa efek musiman. Saya telah memetakan nilai penyesuaian musiman pada Gambar 5.6. Bandingkan bagan itu dengan bagan pada Gambar 5.4. Perhatikan pada Gambar 5.6 bahwa meskipun nilai deseasonalized tidak terletak tepat pada garis lurus, sebagian besar efek musiman telah dihapus. Menekankan Triwulan Deseasonalized ke Periode Waktu Langkah selanjutnya adalah membuat perkiraan dari data yang disesuaikan musiman dan tertimbang pada Gambar 5.6. Sel C20: F24, dan pada titik ini Anda memiliki beberapa alternatif yang tersedia. Anda bisa menggunakan pendekatan differencing yang dikombinasikan dengan perataan eksponensial sederhana yang telah dibahas di Bab 3, 8220 Bekerja dengan Trending Time Series.8221 Anda juga bisa menggunakan pendekatan Holt8217 untuk merapikan seri yang dilemahkan, yang dibahas dalam Bab 3 dan Bab 4, 8220Mengumumkan Prakiraan.8221 Keduanya Metode menempatkan Anda pada posisi untuk membuat perkiraan satu langkah di depan, yang akan Anda tambahkan pada indeks musiman yang sesuai. Pendekatan lain, yang akan digunakan di sini, pertama-tama menempatkan data yang trending melalui contoh regresi linier yang lain dan kemudian menambahkan indeks musiman. Lihat Gambar 5.7. Gambar 5.7 Prakiraan pertama yang benar adalah di baris 25. Gambar 5.7 mengembalikan mean kuartalan dua kali dari pengaturan tabel di C20: F24 pada Gambar 5.6 ke susunan daftar di kisaran C5: C24 pada Gambar 5.7. Kita bisa menggunakan LINEST () dalam hubungannya dengan data di B5: C24 pada Gambar 5.7 untuk menghitung persamaan regresi8217s intercept dan koefisien, maka kita dapat mengalikan koefisien dengan setiap nilai pada kolom B, dan menambahkan intercept ke setiap produk, untuk membuat Prakiraan di kolom D. Tetapi walaupun LINEST () mengembalikan informasi yang berguna selain koefisien dan intercept, TREND () adalah cara yang lebih cepat untuk mendapatkan perkiraan, dan saya menggunakannya pada Gambar 5.7. Rentang D5: D24 berisi perkiraan yang menghasilkan kemunduran angka kuartalan deseasonalized di C5: C24 ke nomor periode di B5: B24. Rumus array yang digunakan dalam D5: D24 adalah ini: Kumpulan hasil tersebut mencerminkan efek dari tren kenaikan umum dalam deret waktu. Karena nilai yang TREND (perkiraan dari perkiraan telah dilakukan sebelumnya, tetap menambahkan efek musiman, juga dikenal sebagai indeks musiman, masuk ke perkiraan tren. Menambahkan Indeks Musiman Kembali Dalam indeks musiman, dihitung pada Gambar 5.6. Disediakan pada Gambar 5.7. Pertama di kisaran C2: F2 lalu berulang kali di kisaran E5: E8, E9: E12, dan seterusnya. Perkiraan prakiraan tersebut ditempatkan pada F5: F24 dengan menambahkan efek musiman pada kolom E ke prakiraan tren di kolom D. Untuk mendapatkan perkiraan satu langkah di sel F25 pada Gambar 5.7. Nilai t untuk periode berikutnya masuk ke sel B25. Rumus berikut dimasukkan ke dalam sel D25: Ini menginstruksikan Excel untuk menghitung persamaan regresi yang memperkirakan nilai pada kisaran C5: C24 dari pada B5: B24, dan menerapkan persamaan tersebut ke nilai x baru pada sel B25. Indeks musiman yang sesuai ditempatkan di sel E25, dan jumlah D25 dan E25 ditempatkan di F25 sebagai perkiraan sejati pertama dari rangkaian waktu historis dan tren. Anda akan menemukan keseluruhan rangkaian kuartalan dan perkiraan yang dipetakan pada Gambar 5.8. Gambar 5.8 Efek musiman dikembalikan ke prakiraan. Mengevaluasi Rata-rata Sederhana Pendekatan untuk menangani seri waktu musiman, yang dibahas di beberapa bagian sebelumnya, memiliki beberapa daya tarik intuitif. Gagasan dasarnya nampak langsung: Hitung tren tahunan dengan cara menghitung rata-rata tahunan terhadap ukuran periode waktu. Bagilah tren tahunan di antara periode dalam tahun ini. Kurangi tren yang terbagi dari efek periodik untuk mendapatkan efek yang disesuaikan. Kurangi efek yang disesuaikan dari ukuran sebenarnya untuk menentukan deret waktu. Buat prakiraan dari seri deseasonalized, dan tambahkan efek musiman yang disesuaikan kembali. Pandangan saya sendiri adalah bahwa beberapa masalah melemahkan pendekatan ini, dan saya tidak akan memasukkannya ke dalam buku ini kecuali bahwa Anda cenderung menemuinya dan oleh karena itu seharusnya familiar Dengan itu Dan ini menyediakan batu loncatan berguna untuk membahas beberapa konsep dan prosedur yang ditemukan pada pendekatan lain yang lebih kuat. Pertama, ada masalah (yang saya keluhkan sebelumnya di bab ini) mengenai ukuran sampel yang sangat kecil untuk regresi mean tahunan ke bilangan bulat berturut-turut yang mengidentifikasi setiap tahunnya. Bahkan dengan hanya satu prediktor, sesedikit 10 pengamatan benar-benar menggores bagian bawah laras. Paling tidak Anda harus melihat R 2 yang dihasilkan disesuaikan untuk penyusutan dan mungkin menghitung ulang kesalahan standar perkiraan yang sesuai. Memang benar bahwa semakin kuat korelasi dalam populasi, semakin kecil sampel yang bisa Anda dapatkan. Tapi bekerja dengan perempat tahun, Anda beruntung bisa menemukan observasi kuartalan sebanyak 10 tahun8217, masing-masing diukur dengan cara yang sama sepanjang rentang waktu itu. Saya tidak yakin bahwa jawaban atas pola up-and-down bermasalah yang Anda temukan dalam setahun (lihat bagan pada Gambar 5.4) adalah rata-rata keluar dari puncak dan lembah dan dapatkan perkiraan tren dari cara tahunan. Tentu saja ini adalah jawaban untuk masalah itu, tapi, seperti yang akan Anda lihat, ada metode yang lebih kuat untuk memisahkan efek musiman dari tren yang mendasarinya, yang menjelaskan keduanya, dan meramalkannya dengan tepat. Sekarang saya akan membahas metode itu di bab ini, di Regresi Terkenal dengan Vector8221 Coded section. Selain itu, tidak ada landasan teori untuk mendistribusikan tren tahunan secara merata di antara periode yang menyusun tahun ini. Memang benar bahwa regresi linier melakukan sesuatu yang serupa saat menempatkan prakiraannya pada garis lurus. Tapi ada jurang besar antara membuat asumsi mendasar karena model analitiknya tidak dapat menangani data, dan menerima hasil yang cacat yang kekurangannya dalam perkiraan akan dapat diukur dan dievaluasi. Konon, mari beralih ke penggunaan rata-rata bergerak, bukan rata-rata sederhana sebagai cara untuk mengatasi musim. Ambillah, Ya, MapReduce dimaksudkan untuk beroperasi pada sejumlah besar data. Dan idenya adalah bahwa secara umum, peta dan mengurangi fungsi seharusnya tidak peduli berapa banyak pemotong atau berapa banyak reduksi yang ada, itu hanya optimasi. Jika Anda berpikir dengan hati-hati tentang algoritma yang saya poskan, Anda dapat melihat bahwa tidak masalah pemeta mana yang mendapatkan bagian data apa. Setiap catatan masukan akan tersedia untuk setiap pengurangan operasi yang membutuhkannya. Ndash Joe K 12 Sep jam 12:30 jam 22:30 Menurut pemahaman saya, rata-rata pergerakan tidak baik memetakan paradigma MapReduce karena penghitungannya pada dasarnya adalah jendela geser karena data yang diurutkan, sementara MR memproses rentang data diurutkan tidak berpotongan. Solusi yang saya lihat adalah sebagai berikut: a) Untuk mengimplementasikan custom partitioner agar bisa membuat dua partisi berbeda dalam dua run. Pada masing-masing run reducer Anda akan mendapatkan rentang data yang berbeda dan menghitung moving average dimana saya akan mencoba untuk menggambarkan: Pada data run pertama untuk reducer seharusnya: R1: Q1, Q2, Q3, Q4 R2: Q5, Q6, Q7, Q8 . Di sini Anda akan cacluate bergerak rata-rata untuk beberapa Qs. Dalam menjalankan selanjutnya reducer Anda harus mendapatkan data seperti: R1: Q1. Q6 R2: Q6. Q10 R3: Q10..Q14 Dan caclulate sisa moving averages. Maka Anda perlu mengumpulkan hasilnya. Ide dari partisi kustom bahwa ia akan memiliki dua mode operasi - setiap kali terbagi menjadi rentang yang sama namun dengan beberapa pergeseran. Dalam sebuah pseudocode akan terlihat seperti ini. Partisi (keySHIFT) (MAXKEYnumOfPartitions) dimana: SHIFT akan diambil dari konfigurasi. MAXKEY nilai maksimal tombol. Saya berasumsi untuk kesederhanaan yang mereka mulai dengan nol. RecordReader, IMHO bukanlah solusi karena terbatas pada split tertentu dan tidak bisa meluncur di atas batas batas. Solusi lain adalah dengan menerapkan logika kustom untuk memisahkan data masukan (ini adalah bagian dari InputFormat). Hal itu bisa dilakukan untuk melakukan 2 slide berbeda, mirip dengan partisi. Jawab 17 Sep 12 jam 8:59

No comments:

Post a Comment