وبینار رایگان برنامه ریزی و حفظ تمرکز در شرایط فعلی یکشنبه ساعت ١٩
اطلاعات وبینار
کنکور کامپیوتر

پردازش تصویر چیست - انواع پردازش تصویر- کاربردهای پردازش تصویر

پردازش تصویر یکی از فیلدهای پرطرفدار مرتبط با گرافیک کامپیوتر، بینایی کامپیوتر، هوش مصنوعی، یادگیری ماشین، و الگوریتم‌ها و محاسبات است که ارتباط تنگاتنگی میان تمام آنهاست. در نتیجه در این صفحه علاوه بر معرفی این فیلد، نقشه راهی نیز برای علاقه‌مندان این حوزه ارائه کرده‌ایم
«انجام یکسری فرآیند بر روی عکس برای استخراج اطلاعات از آن»

این تعریفی است که می‌توان از پردازش تصویر داشت گرچه در منابع مختلف تعاریف مختلفی از آن ذکر شده است.

عملا هر پیشامدی که در اطراف خود حس می‌کنیم، شکلی از عکس یا تصویر را بیان می‌کند. تحقیقات نشان می‌دهد 83 درصد از پردازش‌های حسی از میان حواس پنجگانه، متعلق به حس بینایی است. پس بیایید پیش از پرداختن به فرایند پردازش تصویر ابتدا در مورد خودِ تصویر بیشتر بدانیم، اینکه در اصل تعریف تصویر چیست؛ چیزی که شاید بسیار ساده به نظر برسد!

تصویر چیست؟

به طور کلی، شکلی از داده برای نمایش یک چیز به صورت بَصَری است که در انسان از طریق حس بینایی و در کامپیوتر از طریق بینایی ماشین قابل دریافت، درک، و پردازش است.

از جنبه‌ی فیزیکی، زمانی که پرتو های نور پس از بازتاب یا شکست، به یک حسگر بینایی مانند چشم یا سنسور برخورد می‌کنند، اطلاعاتی به صورت سیگنال دو بُعدی یا سه بُعدی دریافت می‌گردد. این اطلاعاتِ دریافتی در بخش شبکیه چشم انسان به صورت تصویری وارونه و کوچک شده قبضه می‌شود. طبیعی‌ترین پردازش تصویری که می‌توان از آن نام برد، پردازشی است که چشم موجودات زنده بر روی این تصویر اولیه انجام می‌دهد. چشم انسان با اِعمال مجموعه‌ای از فیلترهای نوری یا عصبی، که فیلترهایی خطی هستند، و سپس عملیات نمونه‌برداری، تصویر نهایی را تولید کرده و برای ما این امکان را فراهم می‌آورد که درک بهتری از پیرامون خود داشته باشیم.

تصویر چشم انسان و تشکیل عکس وارونه‌ی برگ در شبکیه چشم که در پشت آن قرار دارد

تصاویر نیز مانند سایر سیگنال‌ها می‌توانند آنالوگ یا دیجیتال باشند. دیجیتال بودن به معنای گسسته بودن مقادیر و آنالوگ بودن به معنای پیوسته بودن آنهاست. به عنوان مثال، تصاویری که با چشم‌هایمان از پیرامون خود دریافت می‌کنیم، تصاویر آنالوگ و تصاویری که در یک کامپیوتر ذخیره می‌شوند، تصاویر دیجیتال هستند. امروزه با پیشرفت تکنولوژی، امکان ثبت، پردازش و استخراج اطلاعات به صورت دیجیتال و به گونه‌ای سریع، آسان و مطمئن میسر شده است.

تصاویر دیجیتال دو بُعدی، دارای ارتفاع (h) و عرض (w) هستند که اگر به آنها به مثابه‌ی بردارهای صفحه با مقادیری گسسته نگاه کنیم، می‌توان به هر سلول از این صفحه مقدار خاصی نسبت داد. به هر کدام از این واحد‌های تشکیل دهنده تصویر، پیکسل (pixel) می‌گویند.

تصویر یک قلب پیکسلی‌شده و نمودار دو بعدی آن

هر پیکسل بسته به نوع عکس، رنگی یا خاکستری بودن آن و طیف مورد استفاده، می‌تواند مقادیر خاصی بگیرد. دو نمونه از مدل‌های معروف نمایش رنگ را می‌توانید در ذیل مشاهده کنید:

سیستم نمایشی Grayscale

در این طیف که طیف خاکستری نامیده می‌شود، هر پیکسل عدد صحیحی بین 0 تا 255 دارد (28  =256 عدد) که می‌توان آنرا با 8 بیت نشان داد. عدد صفر، نشانگر تیره‌ترین (مشکی) و عدد 255، نشانگر روشن‌ترین (سفید) مقدار است.

سیستم نمایشی RGB

در این طیف، هر پیکسل دارای سه کانال است. کانال R به رنگ قرمز، کانال G به رنگ سبز، و کانال B نیز به رنگ آبی اشاره دارد. هر کانال می‌تواند عدد صحیحی بین 0 تا 255 بگیرد که می‌توان هر کدام را با 8 بیت نمایش داد.

سیستم نمایشی CMYK

این سیستم که بر پایه‌ی طیف CMY کار می‌کند، یک مدل رنگ کاهشی است که در چاپ رنگی مورد استفاده قرار می‌گیرد. CMYK مخفف چهار رنگ زیر است:

  • C = Cyan رنگ سبز آبی
  • M = Magenta ارغوانی تیره
  • Y = Yellow زرد
  • K = Key (Black) مشکی


سیستم‌های رنگی معروف RGB, CMYK, Grayscale

تعریف پردازش تصویر به زبان ساده

طبق تعریف سازمان جهانی استانداردسازی (ISO 12087-1:1995)، پردازش تصویر (Image Processing) عبارت است از «تبدیل تصاویر دیجیتال به تصاویر دیجیتال»؛ مثلا تبدیل عکس رنگی به خاکستری، بهبود کُنتراست عکس، تغییر روشنایی عکس، آشکارسازی لبه‌های عکس، تبدیلات هندسی مانند چرخش، بزرگنمایی و ... 

floating-instagram-media.pngبرای روشن‌تر شدن این مساله، نگاهی به زندگی روزمره خود در فضای مجازی بیندازید؛ زمانی که اینستاگرام خود را باز می‌کنید، برای شما صدها عکسی بارگذاری می‌شود که قطعا بر روی صد درصد آنها پردازش تصویر صورت گرفته است. چرا که اینستاگرام، قبل از ذخیره‌ی هر عکس بر روی سرورهای خود، بر روی آنها فشرده‌سازی انجام می‌دهد و این فشرده‌سازی، جزئی جدایی‌ناپذیر از پردازش عکس محسوب می‌گردد. حال بماند که کاربران این شبکه اجتماعی بر روی چه درصد عظیمی از این تصاویر، تبدیلات یا فیلترهای مختلف اعمال کرده‌اند!

تفاوت مفهوم پردازش تصویر با بینایی ماشین

به بیان ساده، بینایی کامپیوتر قابلیت یک سیستم کامپیوتری برای درک اطرافش از طریق یک یا چند چشم دیجیتالی است. در ارتباط با فرق بین پردازش تصویر با بینایی کامپیوتربینایی کامپیوتر و کاربردهای آن چیست و چگونه کار می‌کند؟بینایی کامپیوتر و کاربردهای آن چیست و چگونه کار می‌کند؟کامپیوتر ویژن یا بینائی کامپیوتر، در ارتباط با مدلسازی و تقلید از حس بینایی انسانی از طریق استفاده از نرم‌افزار یا سخت‌افزار دیجیتالی می‌باشد. در این صفحه بینایی ماشین را بصورت کامل بررسی شده است. (computer vision)، نظرات متفاوتی را می‌توان در مقالات متعدد جستجو کرد. عده‌ی اول بر آن هستند که بینایی کامپیوتر، زیرمجموعه‌ای از پردازش تصویر و حاصل اشتراک آن با حوزه هوش مصنوعی و یادگیری ماشین است.

بینایی کامپیوتر، زیر مجموعه‌ی پردازش تصویربینایی کامپیوتر، زیر مجموعه‌ی پردازش تصویر

عده‌ی دوم بر این عقیده‌اند که پردازش تصویر، زیرمجموعه‌ی بینایی کامپیوتر است و از الگوریتم‌های آن بهره می‌برد تا مسائل مربوط به بینائی را در حد مقیاس انسانی شبیه‌سازی کند.

پردازش تصویر، زیر مجموعه‌ی بینایی کامپیوترپردازش تصویر، زیر مجموعه‌ی بینایی کامپیوتر

اما در اصل هیچ کدام از این عقاید درست نیست چرا که هیچ یک از این دو، زیر مجموعه‌ی سَره‌ای از یکدیگر نیستند و باید از زاویه‌ی دیگری به آن‌ها نگاه کرد. تفاوت اساسی این دو، در اهداف آن‌هاست نه در متد و رویه‌ای که استفاده می‌کنند. اگر هدف، بهبود کیفیت عکس برای استفاده‌های آتی باشد، این پروسه را می‌توان پردازش تصویر نامید. از طرفی دیگر اگر هدف، شبیه‌سازی قابلیت‌های بصیرت انسانی باشد می‌توان آن را بینایی ماشین نامید؛ مانند شناسایی اشیاء، شناسایی عیب و ایراد در سیستم‌های مهندسی، شناسایی بدخیم/خوش‌خیم بودن بیماری‌هایی مانند سرطان در تصاویر پزشکی، راننده‌ی اتوماتیک و یا ...

به این کاربردها در ادامه اشاره خواهد شد.

ارتباط واقعی پردازش تصویر و بینایی کامپیوترارتباط واقعی پردازش تصویر و بینایی کامپیوتر

انواع مختلف پردازش تصویر

از سه منظر می‌توان انواع پردازش تصویر را بررسی کرد:

1
پردازش دیجیتال
پردازش آنالوگ
2
پردازش کم عمق
پردازش میان عمق
پردازش پر عمق
3
تصویرنمایی
تشخیص
ترمیم
شناسایی الگو
بازیابی

از نگاه پردازش دیجیتال یا آنالوگ

پردازش تصاویر دیجیتال به صورت پردازش دیجیتال و پردازش تصاویر آنالوگ به صورت پردازش آنالوگ صورت می‌گیرد. پردازش آنالوگ از طریق سیگنال‌های الکتریکی دست‌کاری می‌شوند. تصاویر پزشکی مانند تصاویر حاصل از عکس‌برداری با دستگاه رادیولوژی آنالوگ، به صورت آنالوگ پردازش می‌شوند.

بیشتر مسائل در حوزه پردازش تصویر، مرتبط با پردازش تصویر دیجیتال است چرا که الگوریتم‌های تصاویر دیجیتالی، بسیار متنوع‌تر، سریع‌تر، و آسان‌تر هستند.

از نگاه سطح‌بندی

  • پردازش کم‌ عمق: پردازش‌های ابتدایی مانند فیلتر تصویر، تغییر میزان روشنایی، حذف نویز و ...
  • پردازش میان‌ عمق: پردازش تصویر برای تشخیص اطلاعاتی مانند لبه‌ها، اشیا، و ...
  • پردازش پُر عمق: پردازش تصویر برای تشخیص اطلاعات پیشرفته‌تر مانند تشخیص رابطه بین اشیا و ...

از نگاه تکنیک های پردازشی

فنون پردازش تصاویر دیجیتال به طور عمده در پنج دسته جای می‌گیرند:

  • تصویرنمایی (visualization): آشکارسازی اشیایی که در عکس قابل رؤیت نیستند
  • تشخیص (recognition): تشخیص و شناسایی اشیاء داخل تصویر
  • ترمیم (sharpening and restoration): بهبود کیفیت عکس اصلی
  • شناسایی الگو (pattern recognition): سنجش الگوهای مختلف در پیرامون اشیای داخل تصویر
  • بازیابی (retrieval): جستجوی عکس‌های شبیه به عکس اصلی از میان پایگاه اطلاعاتی تصاویر

مراحل بنیادی پردازش تصویر دیجیتال

مراحل بنیادین پردازش تصویر، قدم‌هایی هستند که لزوما تمام آن‌ها شامل پردازش‌مان نمی‌شود و بسته به کاربرد، برخی از آنها مورد بهره‌ وری قرار می‌گیرد:

1- دستیابی به عکس

این مرحله شامل دریافت عکس از یک منبع نرم‌افزاری یا سخت‌افزاری است. در این مرحله، پیش‌پردازشی مانند تغییر مقیاس (سایز) عکس نیز صورت می‌گیرد.

2- بهبود عکس

در این مرحله، تصویر طوری تنظیم می‌گردد تا برای نمایش یا آنالیز بیشتر در مراحل بعدی با کیفیت مناسب‌تری حاضر گردد. این مرحله معمولا شامل تیز کردن (sharpening) یا تلطیف (smoothing)، افزایش یا کاهش تضاد رنگ (contrast) و روشنایی (brightness)، حذف نویز و ... می‌شود.

3- بازیابی عکس

این مرحله شامل ریکاوری کردن تصویر اوریجینال از تصویری است که به آن نویز یا خط و خش اضافه شده و کیفیت آن تنزل یافته است. در این مرحله بر خلاف مرحله‌ی بهبود عکس، از مدل‌های ریاضیاتی و احتمالاتی برای رفع نویز‌های طبیعی استفاده می‌کنیم.

4- پردازش رنگ عکس

این مرحله تنها شامل تصاویری می‌شود که در طیف رنگی تعریف شده است.

5- موجک ها و رزلوشن های چند گانه

موجک‌ها (wavelets)، موج‌های کوچک با مدت زمان محدودی هستند که برای محاسبه‌ی موج‌های تبدیل استفاده می‌گردند که خود، اطلاعات زمان-فرکانس را در اختیار ما می‌گذارد.

تصاویر به موجک‌ها یا نواحی کوچک‌تری برای فشرده‌سازی اطلاعات و نیز بازنمایی هرمی تقسیم می‌گردند.

6- فشرده سازی

فشرده‌سازی یا کامپرشن، فرایندی است که در آن، فضای لازم برای ذخیره‌سازی یا پهنای باند مورد نیاز برای انتقال تصویر، کاهش یابد.

7- فرآیند مورفولوژیکی یا ریخت‌شناسانه

این مرحله شامل استخراج مؤلفه‌هایی از عکس است که در بازنمایی و توصیف شکل آن موثر باشد. در این مرحله، عملیات پایه‌ای مانند سایش (erosion) و فراخِش (dilation) می‌باشد که هر یک در تصویر زیر توصیف شده‌اند:

dilation and erosion image processing

8- قطعه بندی

این مرحله‌ی دشوار شامل تقسیم‌بندی تصویر به چندین بخش/قطعه می‌باشد که برای یافتن اشیا و مرز بین آنها مورد استفاده قرار می‌گیرد.

نمونه‌ای از قطعه‌بندی معنایی در بینایی کامپیوتر

9- بازنمایی و تشریح

عملیات بازنمایی، با تبدیل داده به شکلی که مناسب برای پردازش کامپیوتری است سر و کار دارد:

  • بازنمایی کرانه‌ای: وقتی استفاده می‌شود که تمرکز بر روی ویژگی‌های خارجی اشکال مانند گوشه‌های شیء (corners) باشد.
  • بازنمایی منطقه‌ای: وقتی استفاده می‌شود که تمرکز بر روی ویژگی‌های داخلی اشکال مانند بافت شکل (texture) باشد.

عملیات تشریح، با استخراج ویژگی‌ها و خصوصیات اشیا سر و کار دارد:

  • باعث تولید برخی اطلاعات کمیّ مورد نیاز می‌گردد
  • برای تمیز دادن یک کلاس از اشیا نسبت به بقیه کلاس‌ها استفاده می‌گردد

10- تشخیص

در این فرایند، با توجه به اطلاعات تشریح، یک برچسب (label) به اشیای داخل تصویر اختصاص داده می‌شود. مثلا برچسب «ماشین»، «انسان»، و ...

کاربرد های پردازش تصویر

پردازش تصویر کاربردهای متنوع و زیادی دارد که از صنعت و مسائل پزشکی گرفته تا کاربردهای روزمره در زندگی همه‌ی ما که به مهم‌ترین آنها اشاره خواهیم کرد:

  • کاربرد در پردازش ویدیو
  • کاربرد در کنترل ترافیک
  • کاربرد در حوزه‌های پزشکی
  • کاربرد در حوزه هواشناسی
  • کاربرد در حوزه صنعت
  • کاربرد در حوزه کشاورزی
  • کاربرد در حوزه شهرسازی
  • کاربرد در حوزه علوم نظامی
  • کاربرد در کدگذاری و فشرده‌سازی پیش از انتقال داده
  • کاربرد در پردازش تصاویر سه بعدی در واقعیت مجازی/افزوده
  • کاربرد در ویرایش تصاویر از طریق نرم‌افزارهای ادیت عکس مانند فوتوشاپ

پردازش تصویر در پزشکی

کاربردهای پردازش تصویر در پزشکی

پردازش تصویر پزشکی (medical image processing) شامل استفاده و کاوش در تصاویر پزشکی و مجموعه داده‌های سه بعدی از اجزای بدن انسان، چه بافت‌های قابل مشاهده و چه اعضای درونی بدن می‌باشد. این تصاویر عمدتا از اسکنرهای معروف در علم پزشکی مانند Computed Tomography یا همان سی‌تی اسکن، Magnetic Resonance Imaging یا همان ام‌آر‌آی و ... به دست می‌آید. این پردازش‌ها می‌تواند در پاتولوژی یا آسیب‌شناسی، هدایت پزشکان و تکنسین‌ها در عمل جراحی و غیره مورد اثر واقع شود.

به عنوان مثال، دکتر علی بشاشتی، استادیار دانشگاه بریتیش کلمبیا (UBC) و محقق در حوزه‌ی بیوانفرماتیک است که تمرکز اصلی وی و تیم پژوهشگری ایشان بر روی ساخت مدلها و الگوریتم‌های مبتنی بر یادگیری ماشین، پردازش سیگنالهای دیجیتال و پردازش تصویر برای اکتشاف اطلاعات موثر و کاربردی برای درمان بیماری‌های مختلف می‌باشد. یکی از تازه‌ترین پروژه‌های تحقیقاتی ایشان مرتبط با تصاویر پزشکی از دهانه‌ی رحم و تخمدان برای تشخیص و دسته‌بندی سرطان تخمدان و ارتباط آن با زیست‏نشانگر ژنتیکی می‌باشد.

مزایای بهره گیری از پردازش تصویر

پُر واضح است که پردازش تصویر مزایای بسیاری دارد که به برخی از آنها اشاره می‌کنیم:

  • تهیه‌ی تصاویر دیجیتال در طیف وسیعی از فرمت‌ها، مدل‌ها و سیستم‌های رنگ‌‌بندی
  • پردازش و استخراج اطلاعات مفید به طوری که بدون چشم مسلح نمایان نباشند
  • ذخیره و بازیابی ساده‌تر و سریع‌تر تصاویر
  • دستکاری و ویرایش تصاویر به صورتی دلخواه

برنامه نویسی در حوزه پردازش تصویر

کتابخانه‌های متعددی برای زبان‌های برنامه‌نویسی مختلف وجود دارد که الگوریتم‌های پردازش دیجیتال تصویر را ساپورت می‌کنند. از جمله کتابخانه‌های محبوب و بهینه، Opencv می‌باشد که هم برای زبان ++C و هم برای پایتون نوشته شده است و مزیت آن در این است که کاملا متن‌باز بوده و با خیال راحت می‌توانید از آن در پروژه‌های مختلف و حتی تجاری خود استفاده کنید.

متلب نیز نرم‌افزار و زبانی محبوب برای برخی از برنامه‌نویس‌هاست که فانکشن‌های متعددی برای الگوریتم‌های پردازش تصویر در آن پیاده‌سازی شده است.

برای آشنایی اولیه در مورد نحوه کدنویسی برای پردازش تصویر، به کدهای زیر توجه کنید. کدها مربوط به MATLAB می‌باشد ولی چون این برنامه دارای لایسنس است شما می‌توانید از GNU Octave استفاده کنید که دستورات آن دقیقا مشابه با متلب بوده و متن‌باز است.

فرض کنید عکسی با نام in.png در محل فعلی برنامه قرار دارد. برای خواندن عکس از فایل، دستور زیر را بنویسید:

;I = imread('in.png')

سپس دستور زیر را برای نمایش عکس که به صورت گرافیکی است را اجرا کنید:

imshow(I)

 حال برای فهمیدن اطلاعات مرتبط با عکس اعم از سایز، حجم و نحوه نگهداری عکس به صورت متغیر در متلب، دستور زیر را اجرا کنید:

whos I

 نتیجه دستورات گفته شده را می‌توانید در تصویر بالا مشاهده کنید.

حال بیاید کنتراست عکس را تغییر دهیم. برای این کار ابتدا اجازه دهید کمی در مورد هیستوگرام توضیح دهیم.

همان طور که می‌دانید، عکس از تعدادی از پیکسل‌ها تشکیل شده است. در یک روش توصیف عکس به صورت خاکستری، هر پیکسل می‌تواند عددی بین 0 تا 255 را بگیرد؛ یعنی 256 حالت دارد. هر چه قدر به عدد 0 نزدیکتر باشد، آن پیکسل سیاه تر و هر چه قدر به 255 نزدیکتر باشد، آن پیکسل سفیدتر است.

حال هیستوگرام (Histogram) چیست؟ هیستوگرام، نموداری است آماری، و نشان‌دهنده‌ی تعداد پیکسل‌ها در هر محدوده‌ی مقادیر پیکسلی؛ بدان معنا که محور افقی آن از 0 تا 255 نشانه گذاری شده که نشان دهنده‌ی مقادیر مجاز برای هر پیکسل است و محور عمودی نیز، تعداد پیکسل‌هایی را نشان می‌دهد که آن مقدار خاص را گرفته است.

به عنوان مثال عکس زیر را مشاهده کنید:

این نمودار نتیجه عملکرد فوق را نشان می‌دهد.

اگر دقت کنید، مثلا حدود 600 تا از پیکسل‌های عکس مورد نظر، دارای مقدار 150 هستند.

این هیستوگرام، مربوط به عکسی است که در مرحله‌ی قبل در متغیر "I" قرار داده و نمایش دادیم.

این هیستوگرام نشان‌دهنده‌ی آن است که بیشتر پیکسل‌های عکس در محدوده‌ی 75 تا 150 هستند که باعث ناواضح بودن عکس و کنتراست نامناسب تصویر می‌شود چرا که کران پایین و بالای مقادیر وجود ندارد. یعنی رنج 0 تا 75 و همچنین 150 تا 255!

در متلب تابعی به نام histeq وجود دارد که مقادیر پیکسل‌ها را طوری متناسب می‌کند که تراکم خطوط در هیستوگرام آن پخش گردد. دستورات زیر را اجرا کنید:

;I2 = histeq(I)

figure

imshow(I2)

دو عکس زیر، قبل و بعد از یکسان‌سازی هیستوگرام است (عکس سمت راست، قبل از تغییر و سمت راست بعد از تغییر است)؛

نتیجه کدنویسی برای پردازش تصویر را می‌توانید در این تصویر مشاهده کنید.

هیستوگرام جدید نیز بدین شکل خواهد بود:

در این نمودار نتیجه عملکرد فوق را می‌توانید مشاهده کنید.

این تنها یک نمونه‌ی کوچک از کارکرد پردازش تصویر به صورت برنامه نویسی بود که در مثال ما، کنتراست تصویر را بهبود بخشیدیم.

توجه کنید که برای پردازش تصویر در پایتون نیز، کتابخانه‌های متعدد و بسیار کارآمد وجود دارد که توابع آن نیز از نظر اسمی شبیه به توابع متلب است.

لیست موضوعات مهم در پردازش تصویر برای شروع قدم به قدم

  • نمایش عکس، نمونه‌برداری، طیف نوری، رنگ
  • عملیات پیکسلی، روشنایی، کانتراست، هیستوگرام
  • نویز، نویز گاوسی، انواع دیگر نویز
  • فیلتر خطی، کانولوشن، بلور کردن
  • تبدیل فوریه دو بعدی، تبدیل فوریه دیجیتال
  • کورِلیشن یا همبستگی نرمال‌شده، فیلتر میانه‌ای، فیلتر دوجانبه
  • گرادیان تصویر، آشکارسازی لبه، عملگرهای لبه‌ای دو بعدی
  • لاپلاسینِ گوُسی، لبه‌یاب Canny

برای یافتن ادامه‌ی سرفصل‌ها به انگلیسی، می‌توانید به سایت درس مبانی بینایی کامپیوتر دکتر نصیحت‌کن (استادیار دانشگاه صنعتی خواجه نصیرالدین طوسی) مراجعه کنید.

نقشه راه یادگیری پردازش تصویر

اگر مهندسی یا علوم کامپیوتر خوانده‌اید و مسائل ریاضی مطرح شده را بلد هستید، از مرحله 1 عبور کنید!

1- پیش نیازهای ریاضیاتی

همانطور که در ابتدای مقاله اشاره کردیم، پردازش تصویر زیرمجموعه‌ای از پردازش سیگنال است و به همین دلیل پیش‌زمینه‌ی قوی‌ای در ریاضی را می‌طلبد. مطالبی همچون:

  • جبر خطی و ماتریس‌ها
  • سیگنال‌ها و سیستم‌ها—تبدیل فوریه
  • سیگنال‌ها و سیستم‌ها—نمونه‌برداری و فیلترها
  • آمار و احتمال مهندسی—احتمالات و قوانین بیزین
  • الگوریتم‌های تصادفی و بهینه‌سازی
  • تجزیه مقدار تکینی (SVD)
  • آنالیز مولفه‌های اصلی (PCA)

ریاضی جزئی جداناپذیر از پردازش تصویر و مبانی بینایی کامپیوتر است!

2- برنامه‌نویسی

در صورتی که برای پردازش تصویر، می‌خواهید برنامه‌سازی کنید، بدین معنی که هدف شما استفاده از نرم‌افزارهای آماده یا پردازش گرافیکی مانند فوتوشاپ، اَدوبی پریمیر و ... نیست، باید حداقل یک زبان برنامه‌نویسی بلد باشید. همانطور که گفتیم، کتابخانه‌های متعددی برای این کار وجود دارد که Opencv محبوب‌ترین آنها در زبان پایتون یا سی پلاس-پلاس است. MATLAB نیز در این زمینه قوی است ولی احتمالا نیازمند خرید لایسنس آن خواهید بود که هزینه چندان کمی هم ندارد!

اگر شما از آن دسته افراد هستید که فقط نام برنامه‌نویسی به گوشتان خورده است و هیچ ایده‌ای ندارید دقیقا چه چیزی است و باید از کجا شروع کنید، مقاله‌ی مربوط به «برنامه‌نویسی چیست» را مطالعه کنید. به هر حال تسلط بر روی مباحث ریاضی قاعدتا امری لازم اما ناکافی است. برای پردازش تصویر و به سر انجام رساندن امور و اهداف مدنظر در این مقوله، حتما بایستی برنامه‌نویس خوبی هم باشید!

3- مفاهیم  پردازش تصویر

در قسمت‌های قبلی به صورت لیست‌وار موضوعات مهم در این زمینه را نام بردیم. حال در این بخش چندین منبع خوب و کاربردی را برای یادگیری عمیق مفاهیم پردازش تصویر معرفی خواهیم کرد:

دانلود کتاب های مرجع درس پردازش تصویر

پردازش تصویر چیست؟

طبق تعریف سازمان جهانی استانداردسازی، پردازش تصویر دیجیتال یا Image Processing عبارت است از «تبدیل تصاویر دیجیتال به تصاویر دیجیتال»؛ مثلا تبدیل عکس رنگی به خاکستری، بهبود کُنتراست عکس، تغییر روشنایی عکس، آشکارسازی لبه‌های عکس، تبدیلات هندسی مانند چرخش، بزرگنمایی، فلیپ و غیره. توصیه میکنیم برای آشنایی بیشتر با پردازش تصویر حتما به این صفحه مراجعه کنید.

کاربرد یادگیری عمیق در پردازش تصویر

برای تسکهایی مانند حذف نویز از تصویر، حذف بک‌گراند از تصویر، انجام تبدیل و ترجمه‌ی عکس به عکس، از یادگیری عمیق یا همان دیپ لرنینگ استفاده می‌گردد. این یادگیری معمولا از طریق شبکه‌های عصبی مصنوعی با داشتن تعداد زیادی لایه‌های میانی صورت می‌گیرد.

زمینه‌های کاری پردازش تصویر

- تصاویر پزشکی: در پردازش تصاویر پزشکی، دانشمندان بر روی ساختار درونی و بافت‌های ارگان‌های حیاتی بدن تحقیق کرده تا بتوانند ناهنجاری‌های مرتبط با آن را سریعتر پیدا کنند.
- امنیت: متخصصان با استفاده از پردازش تصاویری که از دوربین‌های امنیتی خروجی می‌یابد، می‌توانند به تولید جزئیات مهم کمک کنند.
- صنایع نظامی و دفاعی: یکی از موارد استفاده از پردازش تصویر می‌تواند steganography باشد. بدان معنا که متخصصان پیام‌های محرمانه‌ی خود در تصاویر به صورت رمز پنهان می‌کنند.
- زمینه‌های عمومی: بهبود تصاویر برای کاربردهای عمومی با استفاده از ابزارهای ویرایش عکس مانند فوتوشاپ. گرافیست‌ها روزانه با استفاده چنین ابزاری، در واقع پردازش تصویر انجام می‌دهند.

همچنین هر گونه سوالی در مورد کلاس‌های آنلاین کنکور کامپیوتر و یا تهیه فیلم‌ها و یا رزرو مشاوره تک جلسه‌ای تلفنی با استاد رضوی دارید می‌توانید به طرق زیر از تیم پشتیبانی بپرسید:

آی دی تلگرام تیم پشتیبانی:     konkurcomputer_admin@

شماره ثابت موسسه:   09378555200

امتیازدهی4.6 1 1 1 1 1 1 1 1 1 14.60 امتیاز (5 رای)
بارگذاری نظرات