آموزش Mpeg (بخش دوم)
مفهوم MPEG – 7
اطلاعات صدا و تصويري كه در حال حاضر از منابع بيشماري در سراسر دنيا در دسترس مي باشد چه از حيث مقدار و چه تنوع و كيفيت طي روندي غيرقابل كنترل ازدياد مي يابد
اين اطلاعات در شكل هاي متعددي كه اصطلاحا media ناميده مي شود دسته بندي مي گردد،
عكس، طرح هاي گرافيكي (graphic) مدلهاي سه بعدي (3D) خروجي هاي صبا (Audia) سيستم هاي صوتي، مكالمه و خروجي هاي تصوير سيستم هاي تصويري (Video) مهمترين media مدنظر مي باشد و سيستمي كه تقريبا تمام اين اطلاعات را بعنوان ورودي بپذيرد multi – media تلقي مي گردد
در جامعه كنوني ما اطلاعات صدا و تصوير سواي اينكه در چه قالبي (media) قرار داشته باشد (فيلم، نوار مغناطيسي) يا اينكه بطور زنده Live يا real time و با ساختاري آنالوگ يا
ديجيتال از سنسورهاي تصويري يا صوتي پديد آمده باشند نقش مهمي را برعهده دارند
ما با اين كه اطلاعات صدا و تصوير بواسطه انسان از بين مي رود و حالات رو به افزايشي نيز وجود دارد كه بواسطه سيستم هاي پردازشگر اطلاعات جديدي طي فرآيندهاي خاص خلق، تبديل و بازيابي مي گردند.
ديگر موردي كه اطلاعات صوتي و تصويري بعنوان پايه تلقي مي گردند تحت عنوان سناريوي مهم تصوير I maye understandy مي باشد
اين موضوع مورد توجه سيستم هاي حفاظتي دوربين هاي هوشمند و سيستم هاي تصويري جاسوسي مي باشد
تبديل محتوا يا اصطلاحا media conversion موضوع اصلي مي باشد
(تبديل هاي صحبت بستن، تصوير به صحبت، صحبت به تصوير و مثال هايي از فرآيند فوق مي باشد.) retrieval
ديگر سناريوي كه اين استاندار دربر مي گيرد بازيابي مجدد اطلاعات و گزينش اطلاعات filtering بر روي دنباله اي از محتواي صدا و تصوير مي باشد.
(بازيابي مبتني بر جستجوي سريع و كارآمد انواع متعدد اسناد مالتي مديا مورد علاقه كاربرگزينشي مبتني بر پذيرش صرفا عناوين داده هاي مالتي مدياي قانع كننده الويت هاي مدنظر كاربربراي مثال در يك برنامه تلويزيوني كد تعريف شده خاصي مي تواند دستگاه VCR اي را كه از قبل به منظور ضبط برنامه موردنظر برنامه ريزي شده است فعال نمايد يا اينكه سنسور تصويري خاص هنگامي كه يك رويداد مشخص واقع گردد سيستم اخطار را بكار بياندازد.
با بهره گيري از كدگذاري انتقالي خودكار (Auiomatic ranscodeing) ذخيره اي از كاراكترها را به اطلاعات قابل شنيدن ترجمه نمود و يا اينكه عمليات جستجو را در زنجيره اي از اطلاعات صوتي تصويري اجرا نمود.
در تمامي مثال هايي كه ارايه دهد اطلاعات صدا و تصوير به طرزي مناسب دستگاه خاصي device را فعال كرده يا براي تحقق عملكردي به يك كد كامپيوتري ترجمه شده اند.
Voice tag در گويش هاي موبايل امروزه براي شماره گيري بكار مي رود .
در زندگي امروزه ما منابع صوتي تصويري نقش بسزا و فراگيري را برعهده دارند و همواره نياز به داشتن منابع پردازش شده فوق در آينده روند رو به رشدي را مي نماياند.
همين مطلب مؤيد نياز به نمايش نظير قالب هاي توسعه يافته نمايشي از اطلاعات صوتي تصويري وراي قالب هاي معمول شكل موج هاي : ساده، نمونه برداري شده، مبتني بر فشرده سازي (MPEG 1, 2) يا حتي شي ء محور (PEG 4) – Object – based مي باشد.
نياز به قالب هاي نمايشي كه درجه اي از تغيير و تبيين معني سازي اطلاعات را ممكن سازد كاملا احساس مي شود
لذا امكان عبور يا دسترسي اين قالب هاي نمايشي بواسطه هر دستگاه موردنظر يا يك كد كامپيوتري فراهم خواهد شد.
در مثال هايي كه اخيرا درمورد كاربرد MPEG 7 بيان شد اگر داده هاي تصويري توليد شده سنسور تصويري را ملاحظه كنيم ديگر در قالب نمونه هاي PCM متعارف pixel rulues نبوده بلكه در قالب يك شيء با ابعاد فيزيكي انحصاري و اطلاعات زماني مربوطه مطرح مي باشد اين اطلاعات را مي توان ذخيره نمود تا چنانچه شرايط برنامه ريزي شده خاصي محقق گرديد بمنظور رسيدگي صحت و انطباق آن با موضوع موردنظر پردازش شوند.
يك دستگاه ضبط تصوير قادر خواهد بود توضيحي در رابطه با اطلاعات صوتي تصويري متناظر با يك برنامه را بعنوان فرمان بپذيرد و بواسطه آن با مواجهه با چنين برنامه اي فورا سيستم ضبط را فعال سازد.
براي مثال توضيح مي تواند ] فقط خبر به غير از خبر ورزشي[ باشد.
MPEG – 7 استانداردي به منظور توصيف داده هاي محتوايي مالتي مديا خواهد بود بطوريكه بتواند نيازهاي كاربردي را پشتيباني كنند.
نيازمنديهاي لازم براي بكارگيري اين استاندارد در حالت Real – time و non – real time (on/off line) يكي مي باشد.
بايد توجه شود كه اساسا گروه MPEG كاربردها را بررسي يا استاندارد نمي كند ليكن اين اسناد و مدارك تحت عنوان معرفي استاندارد MPEG 7 براساس گستره وسيعي از كاربردهايي است كه مي تواند حيطه اين استاندارد را شكل دهد.
عناصر اصلي استاندارد MPEG-7 عبارتند از :
توصيف گر كه با نماد D حرف اول Discriptor نشان داده مي شود.
شيوه توصيف : Discription scheme (DS)
مشخص كردن سازگان و معاني روابط مابين مؤلفه هاي ماده ديداري – شنيداري موردنظر توصيف گر.
زبان تعريف توصيف Discription Definition (DDL)
ابزارهاي سيستم (system tools)
وظيفه اين ابزارها تامين تلفيق (مالتي پلكس) توصيف ها با محتوا، ساماندهي همزماني توصيف و جايگيري مناسب آن در كنار محتوا، تمهيد مكانيزم هاي انتقالي، كدگذاري، ذخيره سازي و مديريت و تاكيد قابل معني بودن توصيف ها مي باشد.
عملكرد استاندارد MPEG-7 براي هر دو نوع اطلاعات ذخيره شده يا جاري و در محيط non-real time/real time تضمين شده است
محيط real time بدين مضموم اشاره دارد كه پارامترهاي توصيفي همگام با دسترسي آني به محتوا توليد و قابل استفاده خواهند بود.
شكل يك بلوك دياگرام خلاصه اي در رابطه با زنجيره فرآيند كاربري استاندارد MPEG-7 را نشان ميدهد.
اين زنجيره سه بخش اصلي فرآيند را نشان مي دهد:
استخراج پيكربندي (an alysis)
توصيف (MPEG-7)
موتور جستجو (application)
استخراج خودكار توصيف ها (descriptor) لذا اهميت فوق العاده اي برخوردار است.
واضح است كه هميشه اين استخراج اتوماتيك ميسور نمي باشد ليكن چنانچه متذكر شويم به منظور دست يابي به سطح بالايي از اختصار محتوا نيازمند پيچيدگي بيشتر استخراج اتوماتيك خواهد بود.
و لذا استفاده از ابزارهاي استخراجي دوطرفه (interactive) توصيه ميشود.
شكل هاي 2 و 3 فهم بهتري را از عملكرد توصيف گر شيوه توصيف و DDL فراهم مي كنند.
با استناد به نمودار 2، DDL مكانيزمي را جهت بنا شيوه توصيف فراهم مي كند.
شكل شماره 3 زنجيره فرضي استاندارد MPEG-7 را در عمل شرح مي دهد.
بلوك هاي دايره اي شكل معرف واحدهاي عملگر (نظير كدر، ديكدر) و بلوك هاي مربعي معرف عناصر باصطلاح استاتيك (نظير توصيف گر) مي باشند.
نهايتا در شكل فوق عناصر اصلي با بلوكهاي احاطه شده توسط نقطه چين ارايه شده است.
تاكيد استاندارد MPEG-7 تدارك راه حل هاي نو و بديعي براي توصيف محتواهاي ديداري شنيداري مي باشد.
بدين سبب صرفا آدرس دهي (addressing) متني جزو اهداف MPEG-7 نخواهد بود.
البته لازم تذكر است كه علاوه بر اطلاعات صوتي و تصويري امكان ارجاع دادن به يك متني توصيفي نيز دور از انتظار نيست و غالبا استاندارد MPEG-7 راه حل هايي ارايه شده براي توصيف هاي متني توسط ساير ارگان هاي متولي استاندارد مدنظر خود قرار مي دهد.
ناحيه كاربردي MPEG-7
جمله عواملي كه وظيفه تعيين استاندارد MPEG-7 را برعهده دارند گستره وسيعي از كاربرها مي بايد مدنظر قرار دهند (كاربردهايي نظير كتابخانه هاي ديجيتالي مالتي مديا انتخاب راديو تلويزيون يا هر مدياي بروكاست تدريس مالتي مديا وسايل سرگرمي مالتي مدياي خانگي و ...)
MPEG-7 در آينده شبكه اي web را ايجاد مي كند با قابليت جستجوي مالتي مديا شبيه آنچه امروز با قابليت جستجوي متن در اينترنت دراختيار هست.
از نكات جالب توجه اين استاندارد كاربران ويژه براي آرشيوهاي مالتي مدياي با حجم بزرگ براي عامه مي باشد بطوري كه مصرف كننده محصول مالتي مديا (با حجم متنابه) امكان دسترسي به محتواي آن را نظير يك كاتالوگ جهت معرفي آنچه خريداري كرده است دراختيار دارد.
يكي از موارد استفاده اطلاعات ايجادي اين استاندارد در زمينه برودكاست مي باشد انتخاب فيلتر مواد شنيداري ديداري يا حتي تبليغات شخصي توسط كاربرد كه توسط عامل مرتبط تحقق مي پذيرد ازين جمله مي باشند.
البته درحال حاضر تجسم چگونگي استفاده از استاندارد فوق در زمينه هاي متنوع كار آساني نيست ليكن تاحدودي مي توان با ارايه مثال هايي حس لازم را براي آشنايي بهتر با اين استاندارد مطابق زير فراهم كنيم:
معماري، وضعيت حقيقي و طراحي داخلي (بعبارت ديگر جستجو براي منظوري خاص)
انتخاب مديا ديداري و شنيداري برودكاست (بخش فراگير)
سرويس هاي فرهنگي (موزه هاي تاريخ، كالري هاي هنري و ...)
كتابخانه هاي ديجيتالي (كاتالوگ تصويري، ديكشنري موزيكال، كاتالوگهاي تصويربرداري مهندسي پزشكي) آرشيوهاي راديو، ويديو وفيلم.
منبع: www.irib.ir
اطلاعات صدا و تصويري كه در حال حاضر از منابع بيشماري در سراسر دنيا در دسترس مي باشد چه از حيث مقدار و چه تنوع و كيفيت طي روندي غيرقابل كنترل ازدياد مي يابد
اين اطلاعات در شكل هاي متعددي كه اصطلاحا media ناميده مي شود دسته بندي مي گردد،
عكس، طرح هاي گرافيكي (graphic) مدلهاي سه بعدي (3D) خروجي هاي صبا (Audia) سيستم هاي صوتي، مكالمه و خروجي هاي تصوير سيستم هاي تصويري (Video) مهمترين media مدنظر مي باشد و سيستمي كه تقريبا تمام اين اطلاعات را بعنوان ورودي بپذيرد multi – media تلقي مي گردد
در جامعه كنوني ما اطلاعات صدا و تصوير سواي اينكه در چه قالبي (media) قرار داشته باشد (فيلم، نوار مغناطيسي) يا اينكه بطور زنده Live يا real time و با ساختاري آنالوگ يا
ديجيتال از سنسورهاي تصويري يا صوتي پديد آمده باشند نقش مهمي را برعهده دارند
ما با اين كه اطلاعات صدا و تصوير بواسطه انسان از بين مي رود و حالات رو به افزايشي نيز وجود دارد كه بواسطه سيستم هاي پردازشگر اطلاعات جديدي طي فرآيندهاي خاص خلق، تبديل و بازيابي مي گردند.
ديگر موردي كه اطلاعات صوتي و تصويري بعنوان پايه تلقي مي گردند تحت عنوان سناريوي مهم تصوير I maye understandy مي باشد
اين موضوع مورد توجه سيستم هاي حفاظتي دوربين هاي هوشمند و سيستم هاي تصويري جاسوسي مي باشد
تبديل محتوا يا اصطلاحا media conversion موضوع اصلي مي باشد
(تبديل هاي صحبت بستن، تصوير به صحبت، صحبت به تصوير و مثال هايي از فرآيند فوق مي باشد.) retrieval
ديگر سناريوي كه اين استاندار دربر مي گيرد بازيابي مجدد اطلاعات و گزينش اطلاعات filtering بر روي دنباله اي از محتواي صدا و تصوير مي باشد.
(بازيابي مبتني بر جستجوي سريع و كارآمد انواع متعدد اسناد مالتي مديا مورد علاقه كاربرگزينشي مبتني بر پذيرش صرفا عناوين داده هاي مالتي مدياي قانع كننده الويت هاي مدنظر كاربربراي مثال در يك برنامه تلويزيوني كد تعريف شده خاصي مي تواند دستگاه VCR اي را كه از قبل به منظور ضبط برنامه موردنظر برنامه ريزي شده است فعال نمايد يا اينكه سنسور تصويري خاص هنگامي كه يك رويداد مشخص واقع گردد سيستم اخطار را بكار بياندازد.
با بهره گيري از كدگذاري انتقالي خودكار (Auiomatic ranscodeing) ذخيره اي از كاراكترها را به اطلاعات قابل شنيدن ترجمه نمود و يا اينكه عمليات جستجو را در زنجيره اي از اطلاعات صوتي تصويري اجرا نمود.
در تمامي مثال هايي كه ارايه دهد اطلاعات صدا و تصوير به طرزي مناسب دستگاه خاصي device را فعال كرده يا براي تحقق عملكردي به يك كد كامپيوتري ترجمه شده اند.
Voice tag در گويش هاي موبايل امروزه براي شماره گيري بكار مي رود .
در زندگي امروزه ما منابع صوتي تصويري نقش بسزا و فراگيري را برعهده دارند و همواره نياز به داشتن منابع پردازش شده فوق در آينده روند رو به رشدي را مي نماياند.
همين مطلب مؤيد نياز به نمايش نظير قالب هاي توسعه يافته نمايشي از اطلاعات صوتي تصويري وراي قالب هاي معمول شكل موج هاي : ساده، نمونه برداري شده، مبتني بر فشرده سازي (MPEG 1, 2) يا حتي شي ء محور (PEG 4) – Object – based مي باشد.
نياز به قالب هاي نمايشي كه درجه اي از تغيير و تبيين معني سازي اطلاعات را ممكن سازد كاملا احساس مي شود
لذا امكان عبور يا دسترسي اين قالب هاي نمايشي بواسطه هر دستگاه موردنظر يا يك كد كامپيوتري فراهم خواهد شد.
در مثال هايي كه اخيرا درمورد كاربرد MPEG 7 بيان شد اگر داده هاي تصويري توليد شده سنسور تصويري را ملاحظه كنيم ديگر در قالب نمونه هاي PCM متعارف pixel rulues نبوده بلكه در قالب يك شيء با ابعاد فيزيكي انحصاري و اطلاعات زماني مربوطه مطرح مي باشد اين اطلاعات را مي توان ذخيره نمود تا چنانچه شرايط برنامه ريزي شده خاصي محقق گرديد بمنظور رسيدگي صحت و انطباق آن با موضوع موردنظر پردازش شوند.
يك دستگاه ضبط تصوير قادر خواهد بود توضيحي در رابطه با اطلاعات صوتي تصويري متناظر با يك برنامه را بعنوان فرمان بپذيرد و بواسطه آن با مواجهه با چنين برنامه اي فورا سيستم ضبط را فعال سازد.
براي مثال توضيح مي تواند ] فقط خبر به غير از خبر ورزشي[ باشد.
MPEG – 7 استانداردي به منظور توصيف داده هاي محتوايي مالتي مديا خواهد بود بطوريكه بتواند نيازهاي كاربردي را پشتيباني كنند.
نيازمنديهاي لازم براي بكارگيري اين استاندارد در حالت Real – time و non – real time (on/off line) يكي مي باشد.
بايد توجه شود كه اساسا گروه MPEG كاربردها را بررسي يا استاندارد نمي كند ليكن اين اسناد و مدارك تحت عنوان معرفي استاندارد MPEG 7 براساس گستره وسيعي از كاربردهايي است كه مي تواند حيطه اين استاندارد را شكل دهد.
عناصر اصلي استاندارد MPEG-7 عبارتند از :
توصيف گر كه با نماد D حرف اول Discriptor نشان داده مي شود.
شيوه توصيف : Discription scheme (DS)
مشخص كردن سازگان و معاني روابط مابين مؤلفه هاي ماده ديداري – شنيداري موردنظر توصيف گر.
زبان تعريف توصيف Discription Definition (DDL)
ابزارهاي سيستم (system tools)
وظيفه اين ابزارها تامين تلفيق (مالتي پلكس) توصيف ها با محتوا، ساماندهي همزماني توصيف و جايگيري مناسب آن در كنار محتوا، تمهيد مكانيزم هاي انتقالي، كدگذاري، ذخيره سازي و مديريت و تاكيد قابل معني بودن توصيف ها مي باشد.
عملكرد استاندارد MPEG-7 براي هر دو نوع اطلاعات ذخيره شده يا جاري و در محيط non-real time/real time تضمين شده است
محيط real time بدين مضموم اشاره دارد كه پارامترهاي توصيفي همگام با دسترسي آني به محتوا توليد و قابل استفاده خواهند بود.
شكل يك بلوك دياگرام خلاصه اي در رابطه با زنجيره فرآيند كاربري استاندارد MPEG-7 را نشان ميدهد.
اين زنجيره سه بخش اصلي فرآيند را نشان مي دهد:
استخراج پيكربندي (an alysis)
توصيف (MPEG-7)
موتور جستجو (application)
استخراج خودكار توصيف ها (descriptor) لذا اهميت فوق العاده اي برخوردار است.
واضح است كه هميشه اين استخراج اتوماتيك ميسور نمي باشد ليكن چنانچه متذكر شويم به منظور دست يابي به سطح بالايي از اختصار محتوا نيازمند پيچيدگي بيشتر استخراج اتوماتيك خواهد بود.
و لذا استفاده از ابزارهاي استخراجي دوطرفه (interactive) توصيه ميشود.
شكل هاي 2 و 3 فهم بهتري را از عملكرد توصيف گر شيوه توصيف و DDL فراهم مي كنند.
با استناد به نمودار 2، DDL مكانيزمي را جهت بنا شيوه توصيف فراهم مي كند.
شكل شماره 3 زنجيره فرضي استاندارد MPEG-7 را در عمل شرح مي دهد.
بلوك هاي دايره اي شكل معرف واحدهاي عملگر (نظير كدر، ديكدر) و بلوك هاي مربعي معرف عناصر باصطلاح استاتيك (نظير توصيف گر) مي باشند.
نهايتا در شكل فوق عناصر اصلي با بلوكهاي احاطه شده توسط نقطه چين ارايه شده است.
تاكيد استاندارد MPEG-7 تدارك راه حل هاي نو و بديعي براي توصيف محتواهاي ديداري شنيداري مي باشد.
بدين سبب صرفا آدرس دهي (addressing) متني جزو اهداف MPEG-7 نخواهد بود.
البته لازم تذكر است كه علاوه بر اطلاعات صوتي و تصويري امكان ارجاع دادن به يك متني توصيفي نيز دور از انتظار نيست و غالبا استاندارد MPEG-7 راه حل هايي ارايه شده براي توصيف هاي متني توسط ساير ارگان هاي متولي استاندارد مدنظر خود قرار مي دهد.
ناحيه كاربردي MPEG-7
جمله عواملي كه وظيفه تعيين استاندارد MPEG-7 را برعهده دارند گستره وسيعي از كاربرها مي بايد مدنظر قرار دهند (كاربردهايي نظير كتابخانه هاي ديجيتالي مالتي مديا انتخاب راديو تلويزيون يا هر مدياي بروكاست تدريس مالتي مديا وسايل سرگرمي مالتي مدياي خانگي و ...)
MPEG-7 در آينده شبكه اي web را ايجاد مي كند با قابليت جستجوي مالتي مديا شبيه آنچه امروز با قابليت جستجوي متن در اينترنت دراختيار هست.
از نكات جالب توجه اين استاندارد كاربران ويژه براي آرشيوهاي مالتي مدياي با حجم بزرگ براي عامه مي باشد بطوري كه مصرف كننده محصول مالتي مديا (با حجم متنابه) امكان دسترسي به محتواي آن را نظير يك كاتالوگ جهت معرفي آنچه خريداري كرده است دراختيار دارد.
يكي از موارد استفاده اطلاعات ايجادي اين استاندارد در زمينه برودكاست مي باشد انتخاب فيلتر مواد شنيداري ديداري يا حتي تبليغات شخصي توسط كاربرد كه توسط عامل مرتبط تحقق مي پذيرد ازين جمله مي باشند.
البته درحال حاضر تجسم چگونگي استفاده از استاندارد فوق در زمينه هاي متنوع كار آساني نيست ليكن تاحدودي مي توان با ارايه مثال هايي حس لازم را براي آشنايي بهتر با اين استاندارد مطابق زير فراهم كنيم:
معماري، وضعيت حقيقي و طراحي داخلي (بعبارت ديگر جستجو براي منظوري خاص)
انتخاب مديا ديداري و شنيداري برودكاست (بخش فراگير)
سرويس هاي فرهنگي (موزه هاي تاريخ، كالري هاي هنري و ...)
كتابخانه هاي ديجيتالي (كاتالوگ تصويري، ديكشنري موزيكال، كاتالوگهاي تصويربرداري مهندسي پزشكي) آرشيوهاي راديو، ويديو وفيلم.
منبع: www.irib.ir
+ نوشته شده در چهارشنبه سوم شهریور ۱۳۸۹ ساعت 6:54 توسط M V A
|