هوش مصنوعی اشکال مختلفی دارد و یادگیری عمیق یکی از مهمترین آنهاست. این شکل از هوش مصنوعی کاربردهای گستردهای دارد و هر روز یک کاربرد جدید برایش پیدا میشود. به همین خاطر در آینده فناوری و شکل دادن دنیای هوشمندی که انتظارش را داریم، نقش بزرگی خواهد داشت.
کمپانیها و موسسات بزرگی مثل گوگل و MIT پروژههای یادگیری عمیق وسیع و متعددی دارند و هر روز خبر جدیدی درباره دستاوردهایشان منتشر میشود. چون این یکی از بهترین ابزارها برای دستیابی به فناوریهای جدید و هوشمند است.
در این مطلب قصد داریم این فناوری پرطرفدار را به شما معرفی کنیم. اگر دوست دارید بدانید یادگیری عمیق چیست، چطور کار میکند، چه کاربردهایی دارد و چه آیندهای در انتظارش است با آرادمگ همراه است.
یادگیری عمیق چیست؟

یادگیری ماشین و عمیق دوتا از مهمترین زیرمجموعههای هوش مصنوعی هستند. یادگیری عمیق هم نسل بعدی یادگیری ماشین محسوب میشود. در یادگیری ماشین، الگوریتمهای طراحی شده توسط برنامهنویسان با تجزیه دادهها چیزهای جدید یاد میگیرند. سپس براساس چیزهایی که از دادهها یاد گرفتهاند، تصمیم میگیرند.
یادگیری عمیق به عنوان یکی از تکنیکهای یادگیری ماشین هم عملکرد مشابهی دارد. این تکنیک یکی از ویژگیهای مهم مغز انسان را تقلید میکند: یاد گرفتن از طریق مثال. اینکار با استفاده از شبکههای عصبی مصنوعی مشابه مغز انسان انجام میشود. این شبکهها برای آنالیز دادهها از روشهایی استفاده میکنند که شباهت زیادی به روشهای مغز انسان دارد.
در این تکنیک، یک مدل کامپیوتری اجرای طبقهبندی داده را مستقیما از تصاویر، متن یا صدا یاد میگیرد. دسترسی به حجم عظیم دادههای برچسب خورده و ساختارهای شبکه عصبی باعث شده دقت این فناوری در طبقهبندی و تشخیص دادهها به اندازه انسان (و گاهی بیشتر) باشد.
احتمالا از همین دو تعریف متوجه تفاوت یادگیری ماشین و یادگیری عمیق شدهاید. در یادگیری عمیق دیگر نیازی به برنامهنویس نیست که به سیستم بگوید با دادهها چکار کند. بلکه سیستم فقط و فقط به خود دادهها متکی است. حجم عظیم دادههایی که هر روز تولید و مصرف میشود، نقش برنامهنویس را حذف کرده است. در واقع داده سوخت مدلهای یادگیری عمیق است.
البته حذف برنامهنویس در تربیت این مدلها، هزینههایی هم دارد. همین حذف متخصص انسانی باعث افزایش زمان یادگیری برای مدلهای عمیق نسبت به مدلهای ماشینی میشود. از طرفی یادگیری ماشین به دستگاههای گران و پیشرفته و GPU با کارایی بالا نیاز ندارد. اما برای مدلهای عمیق دقیقا برعکس است.
همین تفسیرپذیری توسط نیروی انسانی متخصص باعث شده برخی از متخصصان داده یادگیری ماشین را به مدلهای عمیق ترجیح بدهند. ضمن اینکه یادگیری ماشین برای حجم داده کمتر، گزینه مناسبتری است. در مقابل یادگیری عمیق وقتی به کار گرفته میشود که حجم داده زیاد باشد یا نیروی انسانی نتواند به درک و حل مسائل کمک کند (مثل فناوری تشخیص گفتار یا پردازش زبان طبیعی). نکته جالب هم اینست که هرچه حجم دادهها بیشتر بشود، کیفیت و توانایی مدل هم ارتقا مییابد.
تاریخچه کوتاه یادگیری عمیق
- سال ۱۹۴۳: والتر پیتس و وارن مککالوچ با استفاده از محاسبات و الگوریتمهای ریاضی یک مدل محاسباتی برای شبکههای عصبی ساختند.
- سال ۱۹۵۰: الن تورینگ که بیشتر برای فعالیتهایش در جنگ جهانی دوم شناخته میشود، در مقالهای ظهور ایده یادگیری ماشین و کاربردهای گستردهاش را پیشبینی کرد.
- سال ۱۹۵۷: روانشناسی با نام فرانک روزنبلات در مقالهای ایده ساخت یک سیستم الکترومکانیکی با توانایی یادگیری تفاوتها و شباهتهای بین دو الگو را مطرح کرد.
- سال ۱۹۶۵: در این سال اولین شبکه یادگیری عمیق کارآمد توسط الکسی ایواخننکوی ریاضیدان ساخته شد.
- سال ۱۹۸۰: در این سال برای اولین بار یک شبکه عصبی مصنوعی موفق به تشخیص الگوهای بصری شد. این شبکه عصبی توسط کونیهیکو فوکوشیما طراحی شده بود. دو دانشمند دیگر با نامهای هوبل و وایسل از این شبکه عصبی استفاده کردند و اولین شبکه عصبی پیچیشی را طراحی کردند.
- سال ۱۹۸۲: جان هاپفیلد سیستمی به نام شبکههای هاپفیلد را طراحی کرد. این سیستم که هنوز هم در دنیای هوش مصنوعی کاربرد دارد، نوعی شبکه عصبی مکرر است که یک سیستم حافظه کار میکند.
- سال ۱۹۹۳: یورگن اشمیتهوبر، دانشمند علوم کامپیوتر آلمانی موفق به حل یک مساله یادگیری عمیق مهم شد که تعداد لایههای شبکه عصبی مکرر را به هزارتا افزایش داد.
- سال ۲۰۰۰: ظهور واژه یادگیری عمیق؛ دو متخصص علوم داده در مقالهای نشان دادند میتوان لایههای شبکه عصبی چندلایه را یکی یکی آموزش داد.
- سال ۲۰۱۲: گوگل با ارائه مدلی که الگوریتمش توانایی تشخیص گربهها را داشت، این فناوری را وارد مرحله جدیدی کرد.
- سال ۲۰۱۴: گوگل یک استارتآپ هوش مصنوعی با نام DeepMind را خرید.
- سال ۲۰۱۶: الگوریتم AlphaGo دیپمایند گوگل در یک تورنومنت حرفهای در سئول موفق به شکست یک بازیکن حرفهای در بازی تختهای Go شد.
این سالشمار فقط شامل رویدادهای مهم و تعیینکننده است. اکثر پیشرفتهای حوزه هوش مصنوعی مدیون مدلهای یادگیری عمیق بوده است. این فناوری راه را برای به کار بردن هوش مصنوعی در حوزههای پیچیدهای مثل رباتیک، بازیهای ویدیویی و ماشینهای بدون راننده هموار کرده است.
یادگیری عمیق چطور کار میکند؟
کودک وقتی برای اولین بار سگ را میبیند، با اشاره به آن و تکرار نامش یاد میگیرد سگ چه شکلی هست و چه شکلی نیست. همین طور که اشاره به اجسام را ادامه میدهد، ویژگیهای مختلف انواع سگ را هم یاد میگیرد. کاری که این کودک انجام میدهد، روشن کردن یک انتزاع پیچیده (مفهوم سگ) با ساخت سلسله مراتبی است که هر کدام از لایههایش یکی از لایههای انتزاع را تشکیل میسازد.
روش کار مدلهای یادگیری عمیق هم شبیه مراحلی است که کودک نوپا طی میکند. هر الگوریتم سلسله مراتب، یک تبدیل غیرخطی را روی دادههای خودش اعمال میکند (تبدیل غیرخطی به معنای تغییر رابطه خطی بین ویژگیهای تصاویر ورودی است). سپس از چیزهایی که یاد گرفته برای ساخت یک مدل آماری به عنوان خروجی استفاده میکند. این فرایند آنقدر تکرار میشود تا خروجی به سطح دقت قابل قبولی برسد.
تعداد لایههای درگیر در این پردازش که دادهها از آنها عبور داده میشوند، چیزی است که عمق این روش یادگیری ماشین را مشخص میکند. تعداد لایههای سیستمهای عمیق اولیه ۲ یا ۳تا بود اما اکنون تعداد لایههای شبکههای عمیق به ۱۵۰ میرسد.
در یادگیری ماشین، فرایند یادگیری یک ناظر دارد. این ناظر برنامهنویس باید با دقت بالایی به کامپیوتر بگوید برای تشخیص سگ در تصاویر مختلف باید دنبال چه چیزهایی باشد. این فرایند دستی استخراج ویژگی نام دارد و موفقیت کامپیوتر به میزان دقت برنامهنویس در تعریف ویژگیهای سگ دارد. همانطور که قبلا گفتیم یادگیری عمیق خودش این ویژگیها را تعریف میکند و دیگر به ناظر نیاز ندارد.
در این روش، برنامه کامپیوتری با دادههای آموزشی تغذیه میشود (مجموعهای از تصاویر که توسط انسان با متاتگهای «سگ» یا «غیرسگ» برچسب خوردهاند). برنامه اطلاعات دادههای آموزشی را برای ساخت مجموعه ویژگیهای سگ گردآوری میکند و براساس آنها یک مدل پیشگویانه میسازد. در مثال سگ، لایه اول مدل کامپیوتری به هر چیزی که چهار پا و یک دم داشته باشد برچسب سگ میدهد. البته برنامه کامپیوتری درکی از چهارپا یا دم ندارد و فقط دنبال الگوهای پیکسلی در دادههای دیجیتال میگردد. هربار تکرار این فرایند روی دادههای جدید منجر به افزایش دقت مدل کامپیوتری میشود.
یادگیری و تشخیص مفهوم سگ برای کودک نوپا دست کم چند هفته طول میکشد. اما مدل کامپیوتری به خاطر الگوریتمهای پیچیده و دسترسی به میلیونها تصاویر، اینکار را در عرض چند دقیقه یاد میگیرد.
حالا که میدانید یادگیری عمیق چطور کار میکند، تشخیص اهمیت دسترسی به دادههای زیاد و قدرت پردازش بالا برایتان دشوار نخواهد بود. برای اینکه یک مدل عمیق به دقت بالا برسد به این دو فاکتور نیاز دارد. برنامهنویسها قبلا به این دو مورد دسترسی نداشتند اما ظهور پدیدههایی مثل پردازش کامپیوتری و کلانداده در عصر ما این مشکل را برطرف کرده است.
توانایی مدلهای یادگیری عمیق در ساخت مدلهای آماری پیچیده برمبنای دادههای ورودی، امکان ساخت مدلهای پیشگویانه دقیق برمبنای دادههای بدون برچسب و ساختار را فراهم کرده است. این ویژگی با گسترش اینترنت اشیا اهمیت بیشتری یافته است چون اکثر دادههای تولید شده توسط انسانها و ماشینها بدون برچسب و ساختار هستند. به لطف این ویژگی، برنامهنویسان میتوانند این حجم از داده را در تربیت مدلهای عمیق به کار ببرند.
شبکههای عصبی چه نقشی در یادگیری عمیق دارند؟
شبکههای عصبی مصنوعی یکی از پیشرفتهترین الگوریتمهای یادگیری ماشین است که بخش مهمی از اکثر مدلهای یادگیری ماشین را تشکیل میدهد. به همین خاطر گاهی از این فناوری با عنوان شبکه عصبی عمیق یا یادگیری عصبی عمیق هم یاد میشود.
شبکههای عصبی اشکالی مختلفی دارند و هر کدام برای موارد متفاوتی استفاده میشوند. با این وجود روش کار همهشان تقریبا یکسان است. الگوریتم دادهها را دریافت میکنند و مدل به تنهایی درباره تفاسیر درست یا تصمیمات مبنی بر دادهها تصمیم میگیرد.
شبکههای عصبی شامل فرایندهای آزمون و خطا هستند و برای یادگیری به حجم عظیم داده نیاز دارند. اولین تلاشهای این الگوریتمها شامل حدسهایی برمبنای محتوای یک تصویر یا سخنرانی است و به همین خاطر دادههای مورد استفاده در مرحله آموزش باید برچسب خورده باشند. به این ترتیب مدل میتواند همزمان با آزمون و خطا، دقت حدسهایش را بسنجد.
یکی از مهمترین انواع این شبکهها هم شبکههای عصبی پیچیشی (CNN یا ConvNet) هستند. شبکه عصبی پیچشی، آموختههایش را با دادههای ورودی ترکیب میکند و در کنارش از لایههای پیچشی دوبعدی هم استفاده میکند. دقیقا به همین خاطر بهترین روش برای پردازش دادههای دوبعدی مثل تصاویر محسوب میشود.
شبکههای عصبی پیچشی نیاز به استخراج ویژگی دستی (که توسط نیروی انسانی انجام میشود) را حذف میکنند. همین باعث میشود مدلهای یادگیری عمیق برای یادگیری فقط و فقط به دادههای ورودی متکی باشند. در واقع این شبکهها، ویژگیها را مستقیما از خود تصاویر استخراج میکنند و همانها را برای پردازش و طبقهبندی تصاویر به کار میبندند. همین امر باعث شده مدلهای عمیق یکی از دقیقترین ابزارها برای تسکهای بینایی رایانهای از جمله تقسیمبندی اشیا باشند.
شبکه عصبی پیچشی برای پیدا کردن ویژگیهای مختلف یک تصویر از دهها یا صدها لایه مخفی استفاده میکند. هر لایه مخفی، پیچیدگی ویژگیهای تصویر یاد گرفته شده را بیشتر میکند. مثلا اولین لایه مخفی تشخیص سگ را یاد میگیرد و هرچه لایهها بالاتر بروند، پیچیدگی تصاویر و اشکال مورد نظر بیشتر میشود.
روشهای ساخت مدل یادگیری عمیق
روشهای مخلتفی برای ساخت این مدلها وجود دارد. نرخ یادگیری نزولی، یادگیری انتقالی، آموزش از صفر و حذف تصادفی از مهمترین روشها هستند.
نرخ یادگیری نزولی
در این روش، نرخ یادگیری برای افزایش کارایی و کاهش زمان آموزش تغییر مییابد. تکنیکهای کاهش نرخ یادگیری به مرور زمان از سادهترین و رایجترین روشهای تطبیق نرخ یادگیری است.
یادگیری انتقالی
این روش که در اکثر مدلهای یادگیری عمیق کاربرد دارد از تکمیل مدلهای آموزش دیده قبلی برای ساخت مدل جدید استفاده میکند. در این مدل کار با یک مدل آماده شروع میشود و با دادن دادههای جدید و ناشناخته و اعمال برخی تغییرات، مدل کامپیوتری برای انجام کارهای جدید تربیت میشود. این روش به حجم داده کمتری نیاز دارد و بنابراین زمان محاسبات کامپیوتری به کمتر از یک ساعت کاهش مییابد.
آموزش از صفر
برای آموزش یک شبکه عمیق از صفر، باید حجم عظیمی از دادههای برچسب خورده را داشته باشید و یک ساختار شبکه برای یادگیری ویژگیها طراحی کنید. این روش نسبت به سایر روشها محبوبیت کمتری دارد چون حجم زیاد داده باعث میشود یادگیری چند روز یا چند هفته طول بکشید.
حذف تصادفی
این روش با حذف تصادفی رابطها و ارتباطات آنها در حین آموزش مدل، یکی از مشکلات رایج در شبکههای پرداده به نام بیشبردازش را حل میکند. روش حذف تصادفی میتواند کارایی شبکههای عصبی در حوزههایی مثل تشخیص گفتار، طبقهبندی اسناد و زیستشناسی محاسبانی را افزایش بدهد.
استخراج ویژگی
استفاده از شبکه به عنوان استخراجکننده ویژگی یکی دیگر از این روشهاست که البته کاربردهای محدودی دارد. لایههای شبکه در تمام مراحل کار مشغول گردآوری ویژگیهای تصاویر هستند. برنامهنویسان میتوانند با استخراج این ویژگیها، از آنها برای ترتیب مدلهای دیگر هم استفاده کنند.
کاربردهای یادگیری عمیق
هرکس در هر حوزهای که بخواهد از آنالیز داده بزرگ (big data) استفاده کند، به نحوی با یادگیری عمیق هم سروکار خواهد داشت. پردازش زبان طبیعی، ترجمه، تشخیص پزشکی، تحلیل بازارهای مالی، ایمنی شبکه و تشخیص تصویر فقط برخی از این حوزهها هستند.
هرجا که با حجم عظیمی از داده سروکار داشته باشید، باید ابزاری دقیق برای آنالیز، طبقهبندی و تصمیمگیری و پیشگویی برمبنای آنها هم داشته باشید. در حال حاضر بهترین ابزار برای اینکار مدلهای یادگیری عمیق هستند.
همین باعث شده این شکل هوش مصنوعی کاربردهای بسیار گستردهای داشته باشد. ما در ادامه به برخی از این کاربردها اشاره میکنیم. اما خودتان همه حوزههای درگیر با آنالیز داده بزرگ را به لیست زیر اضافه کنید.
بینایی رایانهای
این یکی از مهمترین حوزههای کاربرد شبکههای عمیق است و به همین خاطر بیشتر رویش تمرکز خواهیم کرد. بینایی یارانهای مستلزم پردازش تصاویر است و هر نوع پردازش هوشمند و اتوماتیک تصاویر بدون کمک هوش مصنوعی زمانبر و حتی گاهی اوقات غیرممکن است. به همین خاطر یادگیری عمیق یکی از بهترین روشها برای تقویت بینایی رایانهای است.
در ادامه به برخی مهمترین کاربردهای این فناوری در زمینه تقویت بینایی رایانهای اشاره خواهیم کرد. بیشتر این مثالها از مواردی هستند که کاربران اینترنت به طور مستقیم با آنها سروکار دارند.
طبقهبندی تصاویر: این تکنیک به هر تصویر یک برچسب اختصاص میدهد. تشخیص سرطان در تصاویر اشعه ایکس، شناسایی ارقام دستنویس و شناسایی افراد از روی تصاویر برخی از کاربردهای طبقهبندی تصاویر است.
طبقهبندی تصاویر با مکانیابی: این تکنیک علاوه بر برچسب زدن به تصاویر، جای جسم مورد نظر را با یک باکس قرمز مشخص میکند.

تشخیص اشیا: این تکنیک کار طبقهبندی تصاویر با مکانیابی را انجام میدهد. با این تفاوت که توانایی آنالیز تصاویر حاوی چند جسم را هم دارد.
تقسیمبندی اجسام: این تکنیک در کنار شناسایی اجسام موجود در تصاویر، با کشیدن خط دور تمام آنها محدودهشان را مشخص میکند.
انتقال سبک: که با نام انتقال سبک عصبی نیز شناخته میشود با یادگیری سبک دو یا چند تصویر، آن سبک را به یک تصویر جدید منقل میکند.
رنگی کردن تصاویر: این تکنیک تصاویر با مقیاس خاکستری یا سیاه و سفید را به تصویر تمام رنگی تبدیل میکند.
بازسازی تصاویر: از این تکنیک برای تکمیل یا پر کردن قسمتهای گمشده یا آسیبدیده تصاویر استفاده میشود.
سوپر رزولوشن (فراتفکیکپذیری): با این تکنیک میتوان رزولوشن و جزییات یک تصویر را افزایش داد.
ترکیب تصاویر: با این تکنیک میتواند چند تصویر را برای ساخت یک تصویر جدید ترکیب کرد. ترکیب تصاویر را میتوان برای ساخت چهرهها جدید و طراحی وسایل مختلف به کار برد.
تولید کپشن برای تصاویر: این تکنیک علاوه بر شناسایی و برچسبگذاری اجسام درون تصاویر میتواند یک کپشن برایش بنویسد. چیزی که گوگل اخیرا از آن استفاده کرده است.
ماشین بدون راننده
همه از نقش هوش مصنوعی در تولید ماشین بدون راننده مطلع هستیم. اما فقط یک مدل این فناوری در سیستمهای خودران کاربرد ندارد. یادگیری عمیق به خاطر توانایی بالا در تشخیص و برچسبگذاری روی تصاویر و اجسام مختلف میتواند دستیابی به این فناوری را سریعتر کند.
وقتی یک ماشین بدون راننده در جاده حرکت میکند، در کنار شناسایی افراد و سایر وسایل نقلیه باید تابلوهای رانندگی را بخواند و مفهوم آنها را درک کند. مدلهای عمیق بهترین ابزار برای رسیدن به این قابلیت است.
پزشکی
یادگیری عمیق میتواند با استفاده از تکنیکهای بینایی رایانهای، تشخیص غدههای سرطانی و سایر عارضهها در تصاویر پزشکی را یاد بگیرد. پس میتواند به تشخیص بیماری، تصویربرداری بهتر، ابزارهای تصمیمگیری کمکی و تشخیص مستقل کمک زیادی کند.
دستیارهای صوتی
جستجوی صوتی و دستیارهای صوتی هوشمند مثل سیری و الکسا هم از این فناری بهره میبرند. یادگیری ماشین با تواناییهایی که در زمینه تشخیص گفتار، شناخت زبانهای مختلف و تولید متن دارد، منجر به پیشرفتهای قابل توجهی در دستیارهای صوتی خواهد شد.
افزودن صوت به فیلم صامت
برای اینکه بیشتر تعجب کنید باید بگوییم اینکار به طور کاملا خودکار و بدون دخالت انسانی انجام میشود. چنین سیستمهایی با مشاهده هزاران ویدیو میتوانند اصوات مختلف را با ویدیوهای صامت ترکیب کنند.
ترجمه ماشینی خودکار
آخرین باری که از گوگل ترنسلیت استفاده کردید را به خاطر دارید؟ احتمالا متنی که دریافت کردید، اشتباهات دستوری زیادی داشت. یادگیری عمیق با خواندن هزاران متن در زبان مبدا و مقصد میتواند ترجمه را بدون اشکال انجام بدهد.
تبلیغات
این شکل از هوش مصنوعی یکی از مواردی است که آینده تبلیغات را دگرگون خواهد کرد. این ابزار برای افزایش نرخ بازگشت کمپینها و میزان ارتباط تبلیغات با مخاطب کاربرد دارد.
شبکههای عصبی در بازارهای مالی
شبکههای عصبی هم به تحلیل بازارهای مالی کمک میکنند (برای سرمایهگذاران) و هم تصمیمگیری در شرکتهای مالی بزرگ را سادهتر میکنند.
رباتهای یادگیری عمیق
مدلهای عمیق کاربردهای زیاد و قدرتمندی در حوزه رباتیک دارند. از این فناوری میتوان برای تربیت ربات فقط و فقط با مشاهده رفتارهای انسان تا تولید رباتهای خانهدار استفاده کرد. با این مدلها میتوان توانایی مغز انسان یادگیری رفتارها و مهارتهای جدید را به رباتها اضافه کرد.
تجربه مشتری
بسیاری از رباتهای پیشرفته از مدلهای یادگیری عمیق استفاده میکنند. هرچه این مدلها و رباتها بالغتر بشوند و چیزهای بیشتری یاد بگیرند، کسب و کارهای بیشتری برای بهبود تجربه مشتری و افزایش رضایت به آنها روی خواهند آورد.
تولید متن
آموزش زبان به مدلهای ماشینی یکی از مهمترین کاربردهای هوش مصنوعی است. یادگیری ماشین و عمیق میتوانند با بررسی و آنالیز دستور زبان و سبک هر متن، چیزهای جدید یاد بگیرند. هرچه اینکار بیشتر بشود، درک آنها از ساختار زبانهای انسانی بیشتر میشود. در نهایت هم میتوانند همان متنهای اولیه را با سبکهای نگارشی متفاوت بازتولید کنند. این تولید متن به کمک ماشین در حوزههای مختلف کاربردهای گستردهای دارد.
اتوماسیون صنعتی
یادگیری عمیق میتواند ابزاری برای افزایش ایمنی کارگران در محیطهای کارخانهای و صنعتی باشد. ساخت سرویسهایی که قابلیت تشخیص خطرات بالقوه را داشته باشند و کارگران را از آنها آگاه کنند، با این فناوری به مراتب سادهتر و موثرتر خواهد بود.
محدودیتها و چالشهای پیش روی یادگیری عمیق
مهمترین محدودیت یادگیری عمیق اینست است از طریق مشاهده یاد میگیرد. این یعنی فقط چیزهایی را یاد میگیرد که در دادههای آموزشی موجود باشد. اگر دادهها محدود باشند یا از منبع مشخصی با ویژگیهای خاص گرفته شده باشند، یادگیری مدل هم محدود میشود.
مشکل سوگیری هم یکی دیگر از مشکلات این دست مدلهاست. اگر مدل با داده حاوی سوگیری آموزش دیده باشد، مدل این سوگیریها را در پیشبینیهایش بازتولید میکند. در چنین مواردی آموزش به اندازه کافی روشن نبوده و به همین خاطر پیشبینی دقت کافی نخواهد داشت. مثلا فناوری تشخیص چهره را در نظر بگیرید؛ اگر دادههای آموزشی به اندازه کافی متنوع نباشد، مدل نهایی هم پیشبینی را براساس جنسیت یا نژاد خاصی انجام خواهد داد.
نرخ یادگیری هم به یکی از مهمترین چالشهای مدلهای یادگیری عمیق تبدیل شده است. اگر نرخ یادگیری بالا باشد، مدل زودتر فراهم میشود و در نتیجه دقت راهکارهایش کاهش مییابد. اگر نرخ یادگیری پایین باشد، احتمالا گیر کردن فرایند پردازش زیاد میشود و دستیابی به راهکار دشوارتر خواهد شد.
سختافزار مورد نیاز برای یادگیری عمیق هم میتواند محدودیت ایجاد کند. ساخت مدلهای عمیق به واحدهای پردازش گرافیکی (GPU) و سایر واحدهای پردازشی پیشرفته نیاز دارد. اما این تجهیزات گران هستند و انرژی زیادی مصرف میکنند.
اینها مهمترین محدودیتها هستند اما مساله به اینجا ختم نمیشود. در ادامه به برخی از این محدودیتها اشاره خواهیم کرد:
- یادگیری عمیق به حجم عظیمی از داده نیاز دارد و قابلیتهای بیشتر مستلزم دادههای بیشتر است.
- مدلهای عمیق بعد از یادگیری غیرمنعطف میشوند و از عهده مولتیتسکینگ برنمیآیند. این مدلها میتوانند نتایج و راهکارهای کامل ارائه بدهند اما امکان رسیدن به نتایج همزمان وجود ندارد.
با وجود همه این محدودیتها و چالشها، آینده یادگیری عمیق روشن است. هرچه بیشتر از این فناوری در حوزههای مختلف استفاده بشود، حجم دادههای بیشتری برای آموزش فراهم میشود. همین میتواند منجر به طراحی و ساخت مدلها و شبکههای عمیقتر بشود.
پاسخ دهید