نرونهاي لايه خروجي به عنوان نرونهاي قابل مشاهده در نظر گرفته مي شوند ، بنابراين رفتار شبکه با شاخص اجرايي زير بيان مي گردد :
معادله 22

جايي که S_L تعداد نرونها در لايه L مي باشد . توجه داريم که در تئوري ، شاخص اجرايي براي تنظيم پارامترهاي شبکه با رابطه زير بيان مي گردد :
معادله 23

درعمل نيز از شاخص اجرايي زير:
معادله 24

براي تنظيم پارامترهاي شبکه استفاده مي شود ، به عبارت ديگر پارامترهاي شبکه ، ماتريس هاي وزن و برداريها باياس، طوري تنظيم مي شوند تا مجموع مربعات خطاي لحظه اي (K)F مينيمم گردد . در رابطه فوق بردار خطاي e برابر است با :
معادله 25
اين مسأله مينيمم سازي ، الگوريتم تقريبي بيشترين کاهش را ايجاد مي کند .

خلاصه الگوريتم BP
در الگوريتم BP دو مسير محاسباتي موجود است : مسير اول ، پيشخور يا رفت ومسير دوم پس خور يا برگشت ناميده مي شود .
مسير رفت : در اين مسير همان گونه که مي بينيم پارامترهاي شبکه در خلال اجراي محاسبات رفت تغيير نمي کنند و توابع محرک ، روي تک تک نرونها عمل مي کند .

مسير برگشت : در اين مسير بردارهاي حساسيت از لايه آخر به لايه اول برگشت داده مي شوند. به عبارت ديگر در مسير برگشت ، شروع کار از لايه خروجي است ،جايي که بردار خطا در اختيار مي باشد . سپس بردار خطا از سمت راست به چپ از لايه آخر به لايه اول توزيع مي شود و گردايان محلي، نرون به نرون با الگوريتم بازگشتي محاسبه مي شود . در اين مسير هم پارامترهاي شبکه تغيير نخواهد کرد .

تنظيم پارامترها : نهايتاً ماتريسهاي وزن و بردارهاي باياس شبکهMLP تنظيم مي گردند . توجه داريم که پس از اعمال هر زوج ورودي و خروجي به عنوان الگوي يادگيري ، برداري هاي ورودي (الگوهاي ورودي) در خلال سه مرحله فوق تغيير نمي کنند . به همين دليل شماره مرحله تکرار K عملاً با اعمال K امين الگو به شبکه معادل است .

توقف :جهت توقف الگوريتم از دو شاخص زير به طور همزمان مي توان استفاده نمود .

الف ) ميانگين مربعات خطا در هرسيکل يا جمع مربعات خطا براي تمامي الگوهاي يادگيري کمتر از مقدار از پيش تعيين شده باشد و يا اينکه فرم تغييرات در پارامترهاي شبکه پس از هرسيکل خيلي کوچک باشد مثلاً اگر 100 مرحله تکرار مي گردد .
ب ) نرم گراديان خطا خيلي کوچک باشد : نرم گرايان خطا از يک مقدار از پيش تعيين شده کوچکتر گردد.

پيشينه تحقيق
الف ) تحقيقات انجام شده در خارج از ايران :
موفقيت کم نظير شبکه هاي عصبي به عنوان ابزاري قدرتمند به منظور تجزيه وتحليل داده ها در علوم تجربي ، موجب شد تا توجه اقتصاد دانان نيز به اين روش مدل سازي جلب شود. ابتدا، با توجه به نياز اين مدلها به داده هاي زياد ، پژوهش و مدل سازي در حوزه اقتصاد با استفاده از شبکه هاي عصبي در بازارهاي مالي آغاز شد و در اواخر دهه 80 ميلادي مدل هاي مختلفي به منظور پيش بيني نرخ هاي ارز ، قيمت سهام وشاخص هاي مختلف بورس ساخته شد.
از جمله اين کارها مي توان به پژوهش وايت (وايت، 1988) که يک شبکه عصبي سه لايه را بر روي 1000 داده از قيمت سهام شرکت IBM به کار گرفت اشاره کرد . هدف وايت به جاي پيش بيني، آزمون کارايي بازار بود . او نتوانست شواهدي را در مقابل نظريه اي که پيشنهاد مي کند يک گام تصادفي بهترين مدل براي پيش بيني بازارهاي مالي است بيابد اما، شبکه استفاده شده وايت بسيار ساده بود و همين امر موجب شد نويسندگان زيادي نتايج وي را به مجادله بگيرند و با استفاده از شبکه پيچيده تر نشان دهند که فرايند غير خطي معني داري در بسياري از سرهاي زماني مالي وجود دارد . از جمله اين کارها مي توان به پژوهش هاي وانگ(1990)، تريپي وتوربان(1990)، بوزاج(1993)، تسيبوريس و زيدنبرگ(1995) ريفنس وديگران (1995)، هيمسترا (1996) ،هافک وهلمنستن (1996) اشاره کرد .
موفقيت شبکه هاي عصبي در حوزه اقتصاد مالي ، توجه متخصصان اقتصاد کلان واقتصاد سنجي را نيز به خود جلب کرد و پژوهش در زمينه استفاده از شبکه هاي عصبي براي پيش بيني مدل سازي در اقتصاد کلان در دهه نود آغاز شد . اوج اين پژوهش ها را مي توان به دوره پس از انتشار مقاله مشهور خوان و وايت (1994) نسبت داد . خوان و وايت در مقاله خود بسياري از موضوعات موازي در شبکه هاي عصبي و اقتصاد سنجي را استخراج کردند و از اين ديدگاه مقاله آنها يک مقدمه پذيرفته شده و قطعي به حساب مي آيد . پيشبرد نظري خوان و وايت در سال 1994 با انجام يک پژوهش کاربردي در همان سال به وسيله معصومي ، ختن زاد و آبايي دنبال شد . اين نويسندگان نشان دادند چهارده سري زماني اقتصاد کلان که نلسون وپلاستر در مقاله اثر گذار خود در سال 1982 مورد تجزيه وتحليل قراردادند ، به خوبي با استفاده از شبکه هاي عصبي قابل مدل سازي هستند . بدون اين شک قوي که اين سري ها از فرايند ريشه واحد پيروي مي کنند .در حقيقت اين موضوع با نتايج پرون (1989) که نشان داد يک يا دو تحول ساختاري موجب ايستايي چنين سري هايي مي شوند سازگار است . در واقع ، قدرت اصلي شبکه هاي عصبي اين است که آنها قادرند براي تحولاتي چون سقوط بازار بورس و شوک هاي نفتي به عنوان انحرافات معني دار از قبول فرض خطي بودن ، مدل هاي بهتري بسازند ( قديمي ومشيري ، 1381)
هيل و ديگران (1994) مجموعه اي از مقاله هاي تجربي و کاربردي را براي مقايسه نتايج پيش بيني شبکه هاي عصبي و مدل هاي آماري مورد بررسي قرار دادند . در مطالعات مورد بررسي آنها ، شبکه هاي عصبي در زمينه پيش بيني متغيرهاي اقتصاد کلان، ب
ا توجه به درصد ميانگين قدر مطلق خطا به خوبي مدل هاي آماري استاندارد و يا بهتر از آنها عمل کردند . در کاربردهاي سري هاي زماني ، نتايج مقاله ها پيشنهاد مي کرد که شبکه هاي عصبي براي پيش بيني با افق زماني طولاني نتايج بهتري را ارايه مي کنند. اين موضع، نويسندگان را به اين تفکر واداشت که داده هايي با تکرار بيشتر داراي فرايندهاي غير خطي بيشتري هستند در هر صورت نويسندگان نتيجه گرفتند که مقاله هاي نگارش شده در زمينه موضوع ، هنوز غير قطعي هستند .
مقاله کهزادي و ديگران (1995) يک مقدمه خوب براي شبکه هاي عصبي وکاربرد هاي آنها در اقتصاد است . اين نويسندگان ضمن پيش بيني معاملات سلف ذرت ، از مقايسه يک شبکه عصبي با يک مدلARIMA با استفاده از معيارهاي مختلف عملکرد پيش بيني دريافتند که خطاي پيش بيني مدل شبکه عصبي بين 18 تا 40 درصد کمتر از مدل ARIMA است .اين چشم انداز نسبي مثبت براي شبکه هاي عصبي به وسيله سه مطالعه ديگر که به پيش بيني توليد اقتصادي پرداخته اند تاييد شده است.

کاکز (1993) صحت مدل هاي خطي وشبکه هاي عصبي براي پيش بيني رشد GDP واقعي کانادا را با استفاده از سري هاي شاخص هاي مالي مقايسه کردند در افق زماني يک فصل بعد و يک سال بعد، شبکه هاي عصبي پيش بيني هاي دقيق تري از مدل هاي خطي ارايه کردند. براساس آزمونهاي مختلف ، بهبود در دقت پيش بيني به دست آمده به وسيله شبکه هاي عصبي به طور کلي از نظر آماري معني دار بودند. نويسنده نتيجه مي گيرد که شبکه هاي عصبی مي توانند فرايندهاي غير خطي در ارتباط ميان رشد توليد ناخالص داخلي واقعي و شاخص هاي مالي را نشان دهند .

به طور مشابه فو (1998) دريافت که براي پيش بيني هاي خارج از نمونه رشد توليد ناخالص داخلي واقعي ايالات متحده ، شبکه هاي عصبي بهتر از مدل ها رگرسيون خطي عمل مي کنند در اين مطالعه شبکه هاي عصبي مجموع مربع پسماندهاي خارج از نمونه را بين 10 تا 20 درصد کاهش دادند .

مودي ، لوين ورفوس (1993) نيز براي پيش بيني نرخ رشد شاخص ايالات متحده نتايج مشابهي به دست آوردند. در اين پژوهش ، براي تمام افق هاي پيش بيني مورد بررسي( يک تا دوازده ماه بعد ) شبکه هاي عصبي آنها ، پيش بيني هاي دقيق تري از مدل اتورگرسيون خطي ارايه کردند .

يک مطالعه ديگر در زمينه پيش بيني نرخ تورم کانادا نيز نتايج مفيدي را براي استفاده از شبکه هاي عصبي به همراه داشت . مشيري وکامرون (2000) عملکرد شبکه هاي عصبي مصنوعي با سري روش هاي اقتصاد سنجي و سري هاي زماني را براي پيش بيني نرخ تورم کانادا مقايسه کردند.در اين مقاله ، آنها مدل هاي شبکه عصبي را با مدل هاي ساختاري VAR،BVAR ،ARMIA براي افق هاي زماني مختلف ( يک ، سه و دوازده ماه بعد) مقايسه مي کنند . معيارهاي به کار گرفته شده در اين پژوهش ، ريشه ميانگين مربع خطاها (RMSE) و ميانگين قدر مطلق خطاها(MAE) نشان دادند که شبکه هاي عصبي قادرند به خوبي تمام روش هاي اقتصادي سنجي سنتي و سريهاي زماني ، و در بعضي از موارد بهتر از آنها نرخ تورم کانادا را پيش بيني کنند .

در مطالعه ديگري درباره تورم کانادا مشيري و ديگران (1999) ، ضمن مقايسه نتايج شبکه هاي عصبي با مدل هاي سري هاي زماني واقتصادي سنجي ، عملکرد شبکه هاي عصبي مرسوم به پس انتشار خطا ( منظور شبکه هاي است که از الگوريتم پس از انتشار خطا براي تخمين استفاده مي کنند )را با شبکه هاي عصبي بازگشتي وشبکه هاي RBF مقايسه مي کنند . در اين پژوهش نيز آنها براي مقايسه نتايج از دو معيار ريشه ميانگين مربع خطاها (RMSE) و ميانگين قدر مطلق خطاها (MAE) استفاده مي کنند و مدل هاي مختلف شبکه هاي عصبي را با يک مدل اقتصاد سنجي ساختاري يک مدل براي پيش بيني نرخ تورم کانادا در سه افق زماني مقايسه مي کنند . مطالعه مشيري و ديگران نشان داد که در پيش بيني هاي ايستا مدل هاي شبکه هاي عصبي مرسوم ( پس انتشار خطا ) نتايجي هم سطح و يا بهتر از ديگر شبکه ها و مدل هاي اقتصادي سنجي دارند اما براي پيش بيني پويا ، شبکه هاي عصبي پس انتشار خطا به طور کلي عملکردي بهتر از مدل اقتصاد سنجي ساختاري ارايه کردند ، اما نسبت به مدل VAR به جز براي افق زماني سه ماه بعد نتايج بهتري را ارايه مي کنند.

مقايسه شبکه هاي عصبي پس انتشار با شبکه هايRBF نيز نشان داد که براي افق هاي زماني کوتاه ( يک وسه ماه بعد ) عملکرد شبکه هاي پس انتشار خطا بهتر است ، اما براي افق هاي زماني يک سال بعد شبکه هاي RBFنتايج بهتري به همراه دارند .

در حوزه بازارهاي مالي ، نيز چندين مطالعه با نتايج مطلوب با استفاده از شبکه هاي عصبي انجام شده است . ورکويجن (1996) دقت مدلهاي مختلف براي پيش بيني نرخ مبادله دلار آمريکا به مارک آلمان در افق هاي زماني 1 تا 36 ماه بعد را با يکديگر مقايسه مي کند . براي پيش بيني خارج از نمونه ، مدل هاي شبکه عصبي اندکي دقيق تر از مدل رگرسيون خطي وپيش بيني گام تصادفي، به ويژه در افق هاي زماني طولاني تر بودند عملکرد شبکه هاي عصبي حتي براي پيش بيني جهت تغييرات نرخ ارز نيز از ساير مدل ها بهتر بود .
در مطالعه ديگر ، رفنس ، زاپرانيس وفرانسيس (1994) دقت يک شبکه عصبي پيش خور و يک مدل رگرسيون خطي را براي پيش بيني عملکرد سهام در چارچوب نظريه قيمت گذاري آربيتراژ مقايسه مي کنند نتايج نشان دادند که براي پيش بيني هاي داخل وخارج از نمونه ، شبکه هاي عصبي دقيق تر هستند .

با وجود آنکه استفاده از شبکه هاي عصبي در مسايل مالي و به ويژه در بازار بورس از قدمت بسيار زيادي برخوردار نيست ولي مطالعات متعدد و وسيعي در اين زمينه صورت گرفته
است .
همچنانکه پيش از اين گفته شد ، شبکه هاي عصبي در حل مسايل با داده هاي وسيع وضابطه اي نامشخص توانايي هاي زيادي دارند . از سوي ديگر مسايل اقتصادي دقيقاً چنين ويژگي هايي دارند يعني در اين مسايل داده ها بسيار زياد است اما روابط حاکم بر داده ها مشخص نيست .بنابراين بکارگيري شبکه هاي عصبي در حل مسايل اقتصادي معقول و منطقي به نظر مي رسد . اين بحث تئوريک در عمل نيز اثبات شده است و به کارگيري شبکه هاي عصبي در اين زمينه نتايج مثبتي داشته است .

جيسون اي . کاتسورليز از دانشگاه مونتري کاليفرنيا در سال 1998 تحقيقی با عنوان « پيش بيني بازارهاي مالي با استفاده از شبکه هاي عصبي » انجام داده است . وي در تحقيق خود مخصوصاً توانايي شبکه هاي عصبي را در پيش بيني شاخص هاي مالي بازار سهام بررسي نمود . کاتسورليز در تحقيق خود از شبکه هاي عصبي و هم از

دسته بندی : پایان نامه ها

دیدگاهتان را بنویسید