معماری جریان داده (Data Flow Architecture)

در معماری جریان داده و یا data flow architecture، تمامی یک سیستم نرم افزاری به عنوان دنباله ای از تغییرات بر روی مجموعه ای از داده های ورودی پشت سر هم دیده می‌شوند. که در آن؛ داده ها و عملیات اتفاق افتاده بر روی داده ها مستقل از یکدیگر هستند. در این رویکرد؛ در ابتدا، داده به درون سیستم وارد شده و از module ها و component های مختلفی که در سیستم وجود دارند، یکی بعد از دیگری عبور می کند، تا زمانی که به مقصد نهایی خود برسد. این مقصد نهایی می تواند یک مخزن ذخیره سازی و یا data store باشد.

اتصالات و ارتباطات مابین module ها و component ها در این سیستم، به روش های مختلفی از قبیل؛ I/O stream ها و I/O buffer ها و pipe ها، پیاده سازی می گردند. داده ها در سیستم می‌توانند بر اساس توپولوژی های مختلف گراف ها به حرکت در بیایند. برخی از این توپولوژی ها شامل؛ توپولوژی های مبتنی بر cycle و یا چرخه، توپولوژی های مبتنی بر خطوط صاف و یا linear که بدون چرخه هستند و یا حتی ساختارهای شبیه درخت ها می باشند.

هدف اصلی این رویکرد؛ به دست آوردن کیفیت های قابلیت استفاده مجدد و همچنین قابلیت تغییر پذیری می باشد. این رویکرد برای آن دسته از سیستم های نرم افزاری مفید است که شامل مجموعه‌ای خوش تعریف از تغییرات مستقل بر روی داده ها و یا محاسبات ترتیبی بر روی داده های ورودی می باشند. این داده های ورودی نهایتاً به عنوان خروجی از سیستم خارج شده و تحویل نرم افزارهای دیگری از قبیل نرم افزارهای پردازش داده های تجاری و یا حتی compiler ها می‌شوند. به طور کلی؛ سه روش برای پیاده سازی کردن دنباله عملیات اجرایی بر روی داده ها و ما بین module ها وجود دارند که عبارتند از؛

سیستم batch sequential

سیستم pipe and filter که با نام non-sequential pipeline mode نیز شناخته می شود

سیستم process control

در ابتدا در رابطه با سیستم batch sequential و در قسمت‌های بعدی در رابطه با دیگر سیستم‌های مربوط به این رویکرد صحبت خواهیم کرد.

سیستم batch sequential

  • در سیستم batch sequential که یک مدل پردازش داده سنتی است، یک زیر سیستم تغییر داده، فقط زمانی می‌تواند فرآیند خود را آغاز کند که زیر سیستم قبلی به صورت کامل عملیات خود را تکمیل کرده باشد.
  • در این سیستم، جریان داده ها، یک مجموعه و یا دسته که معنی کلمه batch می باشد را که از داده ها تشکیل شده است، از یک زیر سیستم به سیستم دیگر حمل می‌کند.
  • ارتباطات بین module ها بر اساس فایل های موقت میانی شکل می گیرد که می‌توانند توسط زیر سیستم های بعدی حذف گردند.
  • از این روش برای آن دسته از نرم‌افزارهای استفاده می‌شود که در آن ها داده ها به صورت دستی و یا batch مورد استفاده قرار گرفته و هر زیر سیستم، فایل های ورودی مرتبط با خود را خوانده و در فایل های خروجی داده هایی را می نویسند.
  • کاربرد معمول این معماری شامل؛ نرم افزارهای پردازش داده های تجاری در حوزه‌های مختلف از قبیل؛ بانکداری و صدور صورتحساب می‌باشد. تصویر زیر مثالی از این موضوع را نشان می‌دهد.


در ادامه در رابطه با مزایا و معایب این سیستم صحبت خواهیم کرد.

مزایای سیستم batch sequential

مهمترین مزیت این سیستم، فراهم کردن تفکیک ساده و مناسب مابین زیر سیستم ها می باشد.

علاوه بر این؛ هر زیر سیستم می‌تواند به عنوان یک برنامه کاملاً مستقل، بر روی مجموعه ای از داده های ورودی کار کند و داده های خروجی خاص خود را تولید نماید.

معایب روش batch sequential

یکی از مهمترین معایب این روش ایجاد کردن latency و یا تاخیر در ایجاد شدن خروجی کار و همچنین بهره بری پایین می باشد.

علاوه بر این؛ انجام عملیات همروندی و یا concurrency، در این نوع از سیستم ها کمی دشوار است.

گذشته از تمامی این موارد؛ کنترل از بیرون و یا اصطلاحاً external control برای پیاده‌سازی این گونه از سیستم ها مورد نیاز است.



پرووید: مرکز آموزش تخصصی برنامه نویسی و توسعه نرم افزار