FMUSER بی سیم ویدئو و صدا را راحت تر انتقال می دهد!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> آفریقایی
sq.fmuser.org -> آلبانیایی
ar.fmuser.org -> عربی
hy.fmuser.org -> ارمنی
az.fmuser.org -> آذربایجانی
eu.fmuser.org -> باسک
be.fmuser.org -> بلاروسی
bg.fmuser.org -> بلغاری
ca.fmuser.org -> کاتالان
zh-CN.fmuser.org -> چینی (ساده شده)
zh-TW.fmuser.org -> چینی (سنتی)
hr.fmuser.org -> کرواتی
cs.fmuser.org -> چکی
da.fmuser.org -> دانمارکی
nl.fmuser.org -> هلندی
et.fmuser.org -> استونیایی
tl.fmuser.org -> فیلیپینی
fi.fmuser.org -> فنلاندی
fr.fmuser.org -> فرانسوی
gl.fmuser.org -> گالیسیایی
ka.fmuser.org -> گرجی
de.fmuser.org -> آلمانی
el.fmuser.org -> یونانی
ht.fmuser.org -> کریول هائیتی
iw.fmuser.org -> عبری
hi.fmuser.org -> هندی
hu.fmuser.org -> مجارستانی
is.fmuser.org -> ایسلندی
id.fmuser.org -> اندونزیایی
ga.fmuser.org -> ایرلندی
it.fmuser.org -> ایتالیایی
ja.fmuser.org -> ژاپنی
ko.fmuser.org -> کره ای
lv.fmuser.org -> لتونیایی
lt.fmuser.org -> لیتوانیایی
mk.fmuser.org -> مقدونی
ms.fmuser.org -> مالایی
mt.fmuser.org -> مالتیایی
no.fmuser.org -> نروژی
fa.fmuser.org -> فارسی
pl.fmuser.org -> لهستانی
pt.fmuser.org -> پرتغالی
ro.fmuser.org -> رومانیایی
ru.fmuser.org -> روسی
sr.fmuser.org -> صربی
sk.fmuser.org -> اسلواکی
sl.fmuser.org -> اسلوونیایی
es.fmuser.org -> اسپانیایی
sw.fmuser.org -> سواحیلی
sv.fmuser.org -> سوئدی
th.fmuser.org -> تایلندی
tr.fmuser.org -> ترکی
uk.fmuser.org -> اوکراینی
ur.fmuser.org -> اردو
vi.fmuser.org -> ویتنامی
cy.fmuser.org -> ولزی
yi.fmuser.org -> ییدیش
1. عمومی
در اوایل مرحله از فناوری آنالوگ در زمینه صوتی و تصویری استفاده می شد و به فناوری دیجیتال تبدیل شده است. مزایای اصلی دیجیتال سازی عبارتند از: قابلیت اطمینان بالا ، می تواند باعث از بین رفتن انتقال و ذخیره سازی شود و پردازش کامپیوتر و انتقال شبکه را تسهیل کند. پس از دیجیتال سازی ، پردازش صدا و تصویر وارد حوزه فناوری رایانه شده است. پردازش صوتی و تصویری اساساً پردازش داده های رایانه ای است.
داده های ویدئویی اصلی تولید شده توسط کسب اطلاعات تصویر بسیار زیاد است. برای برخی از برنامه هایی که پس از دستیابی مستقیماً به صورت محلی پخش می شوند ، به فناوری فشرده سازی نیازی نیست. اما در حقیقت ، برنامه های بیشتری شامل انتقال و ذخیره فیلم هستند. شبکه انتقال و تجهیزات ذخیره سازی نمی توانند مقدار زیادی از داده های اصلی فیلم را تحمل کنند. داده های اصلی فیلم باید قبل از انتقال و ذخیره کدگذاری و فشرده شوند.
2. اصل فشرده سازی فیلم
2.1 آنتروپی و افزونگی
در تمام مواد اصلی برنامه دو نوع م componentsلفه سیگنال وجود دارد: غیر عادی ، پیش بینی نشده و قابل پیش بینی. جز component غیر عادی آنتروپی نامیده می شود که اطلاعات واقعی موجود در سیگنال است. بقیه را افزونگی می نامند زیرا اطلاعات مورد نیاز نیست. افزونگی می تواند فضایی باشد ، به عنوان مثال ، در مناطق بزرگ یک تصویر ، پیکسل های مجاور تقریباً دارای ارزش یکسانی هستند. افزونگی همچنین می تواند زمانی باشد ، مانند یک قسمت مشابه بین تصاویر مداوم. در همه رمزگذاران سیستم فشرده سازی ، آنتروپی از افزونگی جدا شده است ، فقط آنتروپی رمزگذاری و منتقل می شود و افزونگی از سیگنال های ارسال شده توسط رمزگذار در رمزگشای محاسبه می شود.
2.2 کدگذاری درون قاب
کدگذاری درون فریم یک کدگذاری دامنه فضایی است ، که از فزونی مکانی برای فشرده سازی تصاویر استفاده می کند. این یک تصویر مستقل را پردازش می کند و چندین تصویر را در بر نمی گیرد. کدگذاری دامنه مکانی به شباهت بین پیکسل های مجاور یک تصویر و فرکانس اصلی فضایی منطقه الگو بستگی دارد.
از استاندارد JPEG برای تصویر ثابت (یعنی تصویر) استفاده می شود ، فقط از فشرده سازی دامنه فاصله استفاده می شود و فقط از کدگذاری داخل قاب استفاده می شود.
2.3 کدگذاری بین قاب
کدگذاری بین قاب ، کدگذاری دامنه زمانی است که با استفاده از افزونگی زمانی بین مجموعه ای از تصاویر پیوسته ، تصاویر را فشرده می کند. اگر یک تصویر کادر توسط رسیور قابل استفاده باشد ، رسیور می تواند تصویر کادر بعدی را فقط با استفاده از تفاوت دو فریم بدست آورد. به عنوان مثال ، شباهت تصاویر قاب تخت متحرک زیاد است و تفاوت آنها کم است ، در حالی که تصاویر با ورزش شدید مشابه و متفاوت هستند. هنگامی که یک فریم از اطلاعات کامل تصویر بدست می آید ، می توان از مقدار اختلاف بین تصویر و فریم دوم برای محاسبه تصویر کادر دوم استفاده کرد ، بنابراین مقدار داده فشرده می شود. کدگذاری دامنه زمان به شباهت بین تصاویر متوالی متکی است و تصویر فعلی با استفاده از اطلاعات تصویر دریافت شده تا حد ممکن پیش بینی می شود.
استاندارد MPEG برای جابجایی تصویر (به عنوان مثال ویدئو) استفاده می شود ، که از کدگذاری دامنه فضایی و کدگذاری دامنه زمان استفاده می کند ، بنابراین در ترکیب با کدگذاری درون قاب و کدگذاری بین قاب استفاده می شود.
بردار حرکت 2.4
مجموعه ای از تصاویر پیوسته حرکت هدف را ضبط می کنند. بردار حرکت برای اندازه گیری درجه حرکت هدف بین دو قاب استفاده می شود. بردار حرکت از جابجایی افقی و جابجایی عمودی تشکیل شده است.
2.5 جبران حرکت
حرکت هدف شباهت بین تصاویر را کاهش می دهد و میزان اختلاف داده را افزایش می دهد. جبران حرکت با استفاده از بردارها ، میزان اختلاف داده بین تصاویر را کاهش می دهد.
شکل زیر نمودار شماتیک جبران حرکت را نشان می دهد. هنگامی که هدف حرکت می کند ، موقعیت آن تغییر می کند اما رنگ شکل و غیره بدون تغییر می ماند. رمزگذار می تواند اختلاف تصویر را با استفاده از بردار حرکت کاهش دهد ، و رمزگشای می تواند هدف را با توجه به بردار حرکت در اختلاف تصویر به موقعیت مناسب منتقل کند. اگر تصویر ایده آل باشد ، به جز موقعیت متحرک تغییری در هیچ صفتی ایجاد نمی شود ، تفاوت بین این دو تصویر فقط شامل مقدار داده بردار حرکت است. بدیهی است که جبران حرکت می تواند میزان داده های تفاوت تصویر را به میزان قابل توجهی کاهش دهد.
2.6 پیش بینی دو طرفه
در سه تصویر متوالی ، بلوک هدف به صورت عمودی حرکت می کند و بلوک پس زمینه حرکت نمی کند. ما نحوه دستیابی به تصویر قاب فعلی را در نظر می گیریم (تصویر n):
در صفحه n ، هدف به سمت بالا حرکت می کند تا بلوک پس زمینه را نشان دهد.
در صفحه n-1 ، چون بلوک پس زمینه توسط بلوک هدف مسدود شده است ، هیچ اطلاعات مربوط به بلوک پس زمینه وجود ندارد.
در صفحه n + 1 ، داده های بلوک پس زمینه کاملاً گنجانده شده است ، بنابراین صفحه n می تواند بلوک پس زمینه را از صفحه n-1 بدست آورد.
چگونه می توانم صفحه n را دریافت کنم؟ رسیور می تواند ابتدا صفحه n-1 و تصویر n + 1 را رمزگشایی کند. داده های بلوک هدف در تصویر n-1 را می توان با ترکیب داده های بلوک هدف در تصویر n-1 با بردار حرکت بدست آورد. داده های بلوک پس زمینه در تصویر n را می توان با داده های بلوک پس زمینه در صفحه n + 1 بدست آورد. توالی رمزگشایی سه تصویر n-1 ، n + 1 ، n است. توالی نمایش سه عکس n-1 ، N ، n + 1 است. تصویر n با محاسبه (پیش بینی) صورت نقاشی سابق n-1 و سطح بعدی نقاشی n + 1 بدست می آید ، بنابراین این روش را پیش بینی دوسویه (یا پیش بینی رو به جلو ، مرجع دو طرفه) می نامند.
فریم 2.7 I / قاب IDR / قاب P / قاب B
قاب من: قاب I (تصویر درون کدگذاری شده که غالباً به آن keyframe گفته می شود) حاوی اطلاعات کاملی از تصویر است که متعلق به تصویر درون کد کننده است ، بدون بردار حرکت ، و نیازی به مراجعه به سایر تصاویر قاب در هنگام رمزگشایی نیست. بنابراین ، سوئیچینگ کانال می تواند در تصویر I frame بدون از بین رفتن یا رمزگشایی تصویر انجام شود. I frame frame برای جلوگیری از جمع شدن و انتشار خطاها استفاده می شود. در GOP بسته ، اولین فریم از هر GOP باید I frame باشد و داده های GOP فعلی به داده های GOP قبل و بعد ارجاع نخواهند داد.
قاب IDR: قاب IDR (رمزگشایی فوری عکس تازه سازی) یک قاب خاص است. هنگامی که رمزگشای به فرمت IDR رمزگشایی می شود ، DPB (بافر تصویری رمزگشایی شده) پاک می شود ، تمام داده های رمزگشایی شده خارج می شوند یا دور ریخته می شوند و سپس توالی رمزگشایی جدیدی شروع می شود. تصویر بعد از قاب IDR به تصویر قبل از قاب IDR اشاره نمی کند ، بنابراین قاب IDR می تواند از انتشار خطا در جریان ویدئو جلوگیری کند و قاب IDR همچنین یک نقطه دسترسی امن برای رمزگشاها و پخش کننده ها است.
قاب P: قاب P (تصویر رمزگذاری شده پیش بینی شده) یک قاب رمزگذاری بین قاب است که با استفاده از قاب I قبلی یا قاب P پیش بینی و رمزگذاری می شود.
قاب B: عکس پیش بینی شده جهت دار b (قاب تصویر پیش بینی شده دو جهته) یک قاب رمزگذاری بین فریم است و کدگذاری پیش بینی دو جهته با استفاده از قاب I یا قاب P قبل و یا بعد از آن انجام می شود. قاب B نمی تواند به عنوان قاب مرجع استفاده شود.
فریم B سرعت فشرده سازی بالاتری دارد ، اما به زمان بافر بیشتر و اشغال CPU بیشتری نیاز دارد. بنابراین ، فریم B برای ذخیره سازی محلی و فیلمبرداری در صورت تقاضا مناسب است ، اما برای سیستم پخش زنده با نیازهای زمان واقعی بالا مناسب نیست.
GOP 2.8
GOP (گروهی از تصاویر) گروهی از تصاویر پیوسته است که از یک فریم I و چند فریم b / p تشکیل شده است که واحد اصلی دسترسی کدک است. دو پارامتر m و N که معمولاً در ساختار GOP استفاده می شوند ، فاصله بین دو قاب لنگر (قاب I یا قاب P) را در GOP مشخص می کنند و N اندازه یک GOP را مشخص می کند. به عنوان مثال ، m = 3 ، n = 15 ، ساختار GOP ibbpbbbbbbpbbpbb است
Todo: آیا فاصله هر دو فریم لنگر در GOP یکسان است؟ حدس و گمان: لزوماً یکسان نیست. در حقیقت ، بسیاری از پرونده های ویدئویی مورد تجزیه و تحلیل قرار می گیرند و قوانین سازگار نیستند. این کاملاً روشن نیست و باید بیشتر جمع شود ، تحلیل و تأیید شود.
دو نوع GOP وجود دارد: GOP بسته و GOP باز:
GOP بسته شده: GOP بسته شده فقط نیاز به مراجعه به تصاویر موجود در این GOP دارد و نیازی به مراجعه به داده های GOP قبل و بعد از آن نیست. این حالت تعیین می کند که ترتیب نمایش GOP بسته همیشه با فریم I شروع می شود و با فریم P خاتمه می یابد
Todo: آیا GOP بسته شده است که باید با قاب P پایان یابد؟ حدس و گمان: این تعریف ممکن است لازم نباشد. برخی از فایل های ویدئویی GOP دیده می شود که با قاب B ختم می شوند.
GOP را باز کنید: قاب B در GOP باز ممکن است با استفاده از برخی فریمهای GOP قبلی یا GOP دومی رمزگشایی شود. GOP باز فقط وقتی نمایش داده می شود که جریان حاوی فریم B باشد.
Todo: آیا GOP باز شرط می کند که با قاب B شروع شود و با قاب P پایان یابد؟ حدس و گمان: این تعریف ممکن است لازم نباشد. با فریم B شروع می شود؟ داده های آنلاین متفاوت است. با قاب P پایان می یابد؟ برخی از فایل های ویدئویی GOP دیده می شود که با قاب B ختم می شوند.
در GOP باز ، توابع فریم I و قاب IDR متفاوت است ، بنابراین لازم است که دو نوع فریم را به وضوح از هم تشخیص دهیم. در GOP بسته ، تفاوتی بین عملکرد فریم I معمولی و قاب IDR وجود ندارد ، بنابراین نمی توان آن را تشخیص داد.
2.9 DTS و PTS
DTS (رمز گشایی تمبر) زمان رمزگشایی قاب فشرده را نشان می دهد.
PTS (مهر زمان ارائه) زمان نمایش قاب اصلی را پس از رمزگشایی قاب فشرده نشان می دهد.
DTS و PTS از نظر صوتی یکسان هستند. از آنجا که فریم B در ویدئو به پیش بینی دو طرفه احتیاج دارد ، فریم B به فریم قبل و بعد از آن بستگی دارد ، بنابراین توالی رمزگشایی فیلم و توالی نمایش فریم B متفاوت است ، یعنی DTS و PTS متفاوت است. البته فیلم بدون قاب B دارای همان DTS و PTS است. شکل زیر یک نمودار GOP باز را به عنوان مثال نشان می دهد تا توالی رمزگشایی و توالی نمایش جریان ویدئو را نشان دهد
توالی اکتساب به توالی فریم تصویر بدست آمده توسط سیگنال اصلی جمع آوری شده توسط حسگر تصویر اشاره دارد.
توالی کدگذاری به توالی فریم های تصویر پس از کدگذاری رمزگذار اطلاق می شود. فریم های تصویری ذخیره شده در فایل ویدئویی محلی ذخیره شده در دیسک به همان ترتیب نظم رمزگذاری هستند.
توالی انتقال به توالی فریم های تصویر در روند انتقال جریان رمزگذاری شده در شبکه گفته می شود.
توالی رمزگشایی به ترتیب رمزگشایی رمزگشای فریم تصویر اشاره دارد.
منظور از نمایش به ترتیب نمایش فریم های تصویر بر روی صفحه نمایش گفته می شود.
ترتیب کسب همان سفارش است. توالی کدگذاری ، توالی انتقال و توالی رمزگشایی یکسان است.
با استفاده از فریم "b [1]" به عنوان نمونه ، نشان داده شده است که رمزگشایی قاب "b [1]" نیاز به مراجعه به قاب "i [0]" و قاب "p [3]" دارد ، بنابراین "p [3] "قاب باید ابتدا از" b [1] رمزگشایی شود ". این امر منجر به ناسازگاری بین ترتیب رمزگشایی و ترتیب نمایش می شود و ابتدا باید قاب نمایش داده شده حل شود
|
ایمیل را وارد کنید تا غافلگیر شوید
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> آفریقایی
sq.fmuser.org -> آلبانیایی
ar.fmuser.org -> عربی
hy.fmuser.org -> ارمنی
az.fmuser.org -> آذربایجانی
eu.fmuser.org -> باسک
be.fmuser.org -> بلاروسی
bg.fmuser.org -> بلغاری
ca.fmuser.org -> کاتالان
zh-CN.fmuser.org -> چینی (ساده شده)
zh-TW.fmuser.org -> چینی (سنتی)
hr.fmuser.org -> کرواتی
cs.fmuser.org -> چکی
da.fmuser.org -> دانمارکی
nl.fmuser.org -> هلندی
et.fmuser.org -> استونیایی
tl.fmuser.org -> فیلیپینی
fi.fmuser.org -> فنلاندی
fr.fmuser.org -> فرانسوی
gl.fmuser.org -> گالیسیایی
ka.fmuser.org -> گرجی
de.fmuser.org -> آلمانی
el.fmuser.org -> یونانی
ht.fmuser.org -> کریول هائیتی
iw.fmuser.org -> عبری
hi.fmuser.org -> هندی
hu.fmuser.org -> مجارستانی
is.fmuser.org -> ایسلندی
id.fmuser.org -> اندونزیایی
ga.fmuser.org -> ایرلندی
it.fmuser.org -> ایتالیایی
ja.fmuser.org -> ژاپنی
ko.fmuser.org -> کره ای
lv.fmuser.org -> لتونیایی
lt.fmuser.org -> لیتوانیایی
mk.fmuser.org -> مقدونی
ms.fmuser.org -> مالایی
mt.fmuser.org -> مالتیایی
no.fmuser.org -> نروژی
fa.fmuser.org -> فارسی
pl.fmuser.org -> لهستانی
pt.fmuser.org -> پرتغالی
ro.fmuser.org -> رومانیایی
ru.fmuser.org -> روسی
sr.fmuser.org -> صربی
sk.fmuser.org -> اسلواکی
sl.fmuser.org -> اسلوونیایی
es.fmuser.org -> اسپانیایی
sw.fmuser.org -> سواحیلی
sv.fmuser.org -> سوئدی
th.fmuser.org -> تایلندی
tr.fmuser.org -> ترکی
uk.fmuser.org -> اوکراینی
ur.fmuser.org -> اردو
vi.fmuser.org -> ویتنامی
cy.fmuser.org -> ولزی
yi.fmuser.org -> ییدیش
FMUSER بی سیم ویدئو و صدا را راحت تر انتقال می دهد!
تماس با ما
نشانی:
شماره 305 اتاق HuiLan ساختمان شماره 273 Huanpu Road گوانگژو چین 510620
دسته بندی ها
عضویت در خبرنامه