مدل ریاضی شبکه های عصبی
در متون فنی برای نمایش مدل سادهای که در بالا تشریح گردید، بهطور معمول از شکلی مشابه شکل 6 استفاده میشود. در این شکل کلاسیک، از علامت p برای نشان دادن یک سیگنال ورودی استفاده میشود. در واقع در این مدل، یک سیگنال ورودی پس از تقویت (یا تضعیف) شدن به اندازه پارامتر w، بهصورت یک سیگنال الکتریکی با اندازه pw وارد نرون میشود. بهجهات سادهسازی مدل ریاضی، فرض میشود که در هسته سلول عصبی، سیگنال ورودی با سیگنال دیگری به اندازه b جمع میگردد. در واقع سیگنال b خود به معنی آن است که سیگنالی به اندازه واحد در پارامتری مانند b ضرب (تقویت یا تضعیف) میشود. مجموع حاصل، یعنی سیگنالی به اندازه pw + b، قبل از خارج شدن از سلول تحت عمل یا فرآیند دیگری واقع میشود که در اصطلاح فنی به آن تابع انتقال (Transfer Function) میگویند. این موضوع در شکل بهوسیله جعبهای نمایش داده شده است که روی آن علامت f قرار داده شده است. ورودی این جعبه همان سیگنال pw + b است و خروجی آن یا همان خروجی سلول، با علامت a نشانه گذاری شده است. در ریاضی، بخش آخر مدلسازی توسط رابطه (a = f(pw + b نمایش داده میشود. پارامتر w یا همان ضریبی که سیگنال ورودی p در آن ضرب میشود، در اصطلاح ریاضی به نام پارامتر وزن یا weight نیز گفته میشود مدل ریاضی شبکه عصبی کاربرد فراوانی در حوزه های مختلف دارد.
زمانیکه از کنار هم قرار دادن تعداد بسیار زیادی از سلولهای فوق یک شبکه عصبی بزرگ ساخته شود، شبکهای در دست خواهیم داشت که رفتار آن علاوه بر تابع خروجی f، کاملاً به مقادیر w و b وابسته خواهد بود. در چنین شبکه بزرگی، تعداد بسیار زیادی از پارامترهای w و b باید توسط طراح شبکه مقداردهی شوند. این پروسه از کار، در اصطلاح دانش شبکههای عصبی، به فرآیند یادگیری معروف است. در واقع در یک آزمایش واقعی، پس از آنکه سیگنالهای ورودی چنین شبکه بزرگی اتصال داده شدند، طراح شبکه با اندازهگیری خروجی و با انتخاب پارامترهای w و b بهگونهای که خروجی مطلوب بهدست آید، شبکه را«آموزش» میدهد. به این ترتیب پس از آنکه چنین شبکه به ازای مجموعهای از ورودیها برای ساختن خروجیهای مطلوب «آموزش» دید، میتوان از آن برای حل مسائلی که از ترکیب متفاوتی از ورودیها ایجاد میشوند، بهره برد.
تابع f میتواند بر حسب کاربردهای گوناگون بهطور ریاضی، به شکل های متفاوتی انتخاب شود. در برخی از کاربردها، پاسخ مسائل از نوع دودویی است. مثلاً مسأله بهگونهای است که خروجی شبکه عصبی باید چیزی مانند”سیاه” یا “سفید” (یا آری یا نه) باشد. در واقع چنین مسائلی نیاز به آن دارند که ورودیهای دنیای واقعی به مقادیر گسسته مانند مثال فوق تبدیل شوند. حتی میتوان حالاتی را در نظر گرفت که خروجی دودویی نباشد، اما همچنان گسسته باشد. به عنوان مثال، شبکهای را در نظر بگیرید که خروجی آن باید یکی از حروف الفبا، مثلاً از بین کاراکترهای اسکی (یا حتی یکی از پنجاه هزار کلمه متداول زبان انگلیسی) باشد. در چنین کاربردهایی، روش حل مسئله نمیتواند صرفاً بر جمع جبری سیگنالهای ورودی تکیه نماید. در این کاربردها، ویژگیهای خواسته شده فوق، در تابع خروجی یا تابع انتقال f گنجانیده میشوند که میتوان در پروژه شبکه عصبی استفاده کرد مثلاً اگر قرار باشد خروجی فقط یکی از مقادیر صفر یا یک را شامل شود، در این صورت میتوان تابع خروجی شبکه عصبی را به شکل بخش a شکل شماره 7 انتخاب کرد. در این حالت، خروجی چنین شبکهای فقط میتواند بر حسب ورودیهای متفاوت، مقدار یک یا صفر باشد.