اصول اساسی H264

مقدمه
الگوریتم فشرده سازی فیلم H264 اکنون بدون شک از همه تکنیک های فشرده سازی ویدیو به طور گسترده استفاده می شود و محبوب ترین است. با معرفی کتابخانه های منبع باز مانند x264 / openh264 و ffmpeg ، اکثر کاربران دیگر نیازی به تحقیق بیش از حد در مورد جزئیات H264 ندارند ، که هزینه های استفاده از H264 را تا حد زیادی کاهش می دهد.

اما برای استفاده مناسب از H264 ، ما هنوز باید اصول اساسی H264 را کشف کنیم. امروز نگاهی خواهیم انداخت به اصول اساسی H264.

فناوری فشرده سازی H264 عمدتا از روش های زیر برای فشرده سازی داده های ویدئویی استفاده می کند. عبارتند از:

فشرده سازی پیش بینی درون قاب ، مشکل افزونگی داده های مکانی را حل می کند.
فشرده سازی پیش بینی بین قاب (برآورد حرکت و جبران حرکت) مشکل افزونگی داده های حوزه زمان را حل می کند.
Integer Discrete Cosine Transform (DCT) ، که همبستگی فضایی را به داده های نامربوط در حوزه فرکانس تبدیل می کند و سپس آن را کمی می کند.
فشرده سازی CABAC.
قاب فشرده شده به تقسیم می شود: قاب I ، قاب P و قاب B:

I frame: قاب اصلی ، با استفاده از فناوری فشرده سازی درون قاب.
قاب P: قاب مرجع به جلو ، هنگام فشرده سازی ، فقط به قاب پردازش شده قبلی مراجعه کنید. از فناوری فشرده سازی صوتی قاب استفاده کنید.
فریم B: یک قاب مرجع دو طرفه. در هنگام فشرده سازی ، به قاب قبلی و قاب زیر اشاره دارد. استفاده از فناوری فشرده سازی بین قاب.
علاوه بر فریم های I / P / B ، توالی تصویر GOP نیز وجود دارد.

GOP: بین دو فریم یک توالی تصویر وجود دارد و فقط یک فریم من در یک توالی تصویر وجود دارد. همانطور که در زیر نشان داده شده است:

اکنون ما فناوری فشرده سازی H264 را به طور کامل شرح خواهیم داد.

فناوری فشرده سازی H264
اصل اساسی H264 در واقع بسیار ساده است ، بیایید روند فشرده سازی داده های H264 را به طور خلاصه شرح دهیم. فریم های ویدئویی گرفته شده توسط دوربین (محاسبه شده با 30 فریم در ثانیه) به بافر رمزگذار H264 ارسال می شوند. رمزگذار ابتدا باید ماکروبلاک ها را برای هر تصویر تقسیم کند.

ماکروبلاک پارتیشن
H264 به طور پیش فرض از یک منطقه 16X16 به عنوان بلوک کلان استفاده می کند و همچنین می تواند به اندازه 8X8 تقسیم شود.

پس از تقسیم بلوک ماکرو ، مقدار پیکسل بلوک ماکرو را محاسبه کنید.

با تشبیه ، مقدار پیکسل هر ماکروبلاک در یک تصویر محاسبه می شود و کلیه ماکروبلاک ها به شرح زیر پردازش می شوند.

زیر بلوک
H264 از تصاویر ماکروبلاک 16X16 برای تصاویر نسبتاً مسطح استفاده می کند. با این حال ، برای دستیابی به میزان فشرده سازی بالاتر ، زیر بلوک های کوچکتر را نیز می توان به ماکروبلاک های 16X16 تقسیم کرد. اندازه زیر بلوک می تواند 8X16 ، 16X8 ، 8X8 ، 4X8 ، 8X4 ، 4X4 باشد که بسیار انعطاف پذیر است.

در تصویر بالا ، اکثر ماکروبلاک های 16X16 در قاب قرمز زمینه آبی دارند و بخشی از تصویر سه عقاب در این ماکروبلاک ترسیم شده است. به منظور پردازش بهتر تصاویر جزئی از سه عقاب ، زیر بلوک های H264 Multiple به 16 ماکروبلاک 16XXNUMX تقسیم می شوند.

به این ترتیب ، پس از فشرده سازی درون قاب ، می توان داده های کارآمدتری به دست آورد. شکل زیر نتیجه فشرده سازی ماکروبلاک های فوق به ترتیب با استفاده از mpeg-2 و H264 است. نیمه سمت چپ نتیجه فشرده سازی بعد از تقسیم زیر بلوک MPEG-2 است و نیمه سمت راست نتیجه فشرده سازی زیر بلوک H264 است. دیده می شود که روش تقسیم H264 از مزایای بیشتری برخوردار است.

پس از تقسیم بلوک ماکرو ، می توان تمام تصاویر موجود در بافر رمزگذار H264 را گروه بندی کرد.

گروه بندی قاب
برای داده های ویدئویی ، به طور عمده دو نوع افزونگی داده وجود دارد ، یکی افزونگی داده در زمان ، و دیگری افزونگی داده در فضا. در میان آنها ، افزونگی داده ها در زمان بیشترین است. بیایید ابتدا در مورد مشکل افزونگی زمان داده های ویدیویی صحبت کنیم.

چرا افزونگی زمان بیشترین است؟ با فرض اینکه دوربین 30 فریم در ثانیه ضبط می کند ، داده های این 30 فریم بیشتر مرتبط هستند. همچنین ممکن است بیش از 30 فریم داده ، ده ها فریم یا صدها فریم داده به طور ویژه با هم ارتباط داشته باشند.

در واقع ، برای این فریم های بسیار نزدیک ، ما فقط باید یک فریم داده را ذخیره کنیم ، و فریم های دیگر را می توان طبق قوانین خاص از این قاب پیش بینی کرد ، بنابراین داده های ویدیویی بیشترین زمان افزونگی را دارند.

برای دستیابی به اینكه فریم های مربوطه داده ها را از طریق روش پیش بینی فشرده می كنند ، لازم است كه فریم های ویدئویی گروه بندی شوند. بنابراین چگونه می توان تشخیص داد که قاب های خاصی با هم ارتباط نزدیک دارند و می توان آنها را با هم گروه بندی کرد؟ بیایید نگاهی به مثالی بیندازیم. در زیر یک قاب فیلم گرفته شده از یک گروه توپ بیلیارد در حال حرکت است. توپ های بیلیارد از گوشه بالا سمت راست به گوشه پایین سمت چپ می چرخند.

رمزگذار H264 برای محاسبه تشابه دو فریم ، هر بار دو فریم مجاور برای مقایسه ماکروبلاک ها بیرون می آورد. همانطور که در زیر نشان داده شده است:

از طریق اسکن بلوک ماکرو و جستجوی بلوک ماکرو می توان دریافت که همبستگی بین این دو فریم بسیار زیاد است. علاوه بر این ، مشخص شد که درجه همبستگی این گروه از فریم ها بسیار زیاد است. بنابراین ، قاب های فوق را می توان به یک گروه تقسیم کرد. الگوریتم این است: در تصاویر مجاور ، پیکسلهایی که به طور کلی متفاوت هستند فقط در 10٪ هستند ، اختلاف روشنایی از 2٪ فراتر نمی رود و اختلاف رنگی فقط در 1٪ تغییر می کند. ما فکر می کنیم این نمودارها را می توان با هم گروه بندی کرد.

در چنین گروهی از فریم ها ، پس از رمزگذاری ، ما فقط اطلاعات کامل پست اول را نگه می داریم و سایر فریم ها با مراجعه به فریم قبلی محاسبه می شوند. ما اولین فریم را فریم IDR / I می خوانیم و فریم های دیگر را قاب P / B می نامیم ، بنابراین گروه فریم داده رمزگذاری شده را GOP می نامیم.

برآورد و جبران حرکت
پس از گروه بندی فریم ها در رمزگذار H264 ، لازم است بردارهای حرکت اشیا in موجود در گروه قاب محاسبه شود. با استفاده از قاب فیلم بیلیارد متحرک فوق الذکر ، بیایید نگاهی به نحوه محاسبه بردار حرکت بیندازیم.

رمزگذار H264 ابتدا دو فریم از داده های ویدئویی را به ترتیب از سربرگ بافر خارج می کند ، و سپس اسکن بلوک ماکرو را انجام می دهد. هنگامی که یک شی در یکی از تصاویر یافت می شود ، جستجو در مجاورت عکس دیگر (در پنجره جستجو) انجام می شود. اگر در این زمان جسم در تصویر دیگری پیدا شود ، بردار حرکت جسم قابل محاسبه است. تصویر زیر موقعیت توپ بیلیارد را پس از جستجو نشان می دهد.

از طریق تفاوت بین موقعیت های توپ های بیلیارد در تصویر بالا ، جهت و فاصله تصویر جدول را می توان محاسبه کرد. H264 فاصله و جهت حرکت توپ را در هر فریم به نوبه خود ثبت می کند و به شکل زیر در می آید.

پس از محاسبه بردار حرکت ، همان قسمت (یعنی قسمت سبز) کم می شود تا داده های جبران بدست آید. در پایان ، ما فقط باید داده های جبران را فشرده و ذخیره کنیم ، و سپس تصویر اصلی می تواند هنگام رمزگشایی بازیابی شود. داده های فشرده شده فقط نیاز به ثبت مقدار کمی از داده ها دارند. به شرح زیر است:

ما بردار حرکت و جبران را فناوری فشرده سازی بین قاب می نامیم ، که باعث کاهش زمان افزونگی داده فریم های ویدیویی می شود. علاوه بر فشرده سازی بین فریم ، فشرده سازی داده ها نیز باید در داخل فریم انجام شود. فشرده سازی داده های درون فریم افزونگی داده های مکانی را حل می کند. اکنون ما فناوری فشرده سازی درون قاب را معرفی خواهیم کرد.

پیش بینی درون
چشم انسان دارای درجه ای از تشخیص تصویر است ، به روشنایی فرکانس پایین بسیار حساس است و به روشنایی فرکانس بالا بسیار حساس نیست. بنابراین ، بر اساس برخی تحقیقات ، داده هایی را که به چشم انسان حساس نیستند ، می توان از یک تصویر حذف کرد. به این ترتیب ، فناوری پیش بینی درونی پیشنهاد می شود.

فشرده سازی داخل فریم H264 بسیار شبیه به JPEG است. بعد از اینکه یک تصویر به ماکروبلاک تقسیم شد ، می توان هر ماکروبلاک را در 9 حالت پیش بینی کرد. حالت پیش بینی را که نزدیک ترین حالت به تصویر اصلی است پیدا کنید.

تصویر زیر روند پیش بینی هر بلوک کلان در کل تصویر است.

مقایسه بین تصویر پس از پیش بینی درونی و تصویر اصلی به شرح زیر است:

سپس ، برای بدست آوردن مقدار باقیمانده ، تصویر اصلی و تصویر پیش بینی شده کم می شود.

سپس اطلاعات حالت پیش بینی را که قبلاً دریافت کردیم ذخیره کنید تا بتوانیم هنگام رمزگشایی تصویر اصلی را بازیابی کنیم. اثر به شرح زیر است:

بعد از فشرده سازی درون فریم و درون قاب ، اگرچه داده ها بسیار کاهش می یابد ، اما هنوز هم جای بهینه سازی وجود دارد.

DCT را روی داده های باقیمانده انجام دهید
برای حذف همبستگی داده ها و فشرده سازی بیشتر داده ها ، می توان در معرض تبدیل کسینوس گسسته عدد صحیح قرار گرفت. همانطور که در شکل زیر نشان داده شده است ، سمت چپ بلوک کلان داده های اصلی است و سمت راست بلوک کلان داده های باقیمانده محاسبه شده است.

ماکروبلاک داده های باقیمانده مانند شکل زیر دیجیتالی می شود:

تبدیل DCT در ماکروبلاک داده های باقیمانده انجام می شود.

پس از حذف داده های مرتبط ، می توان فهمید که داده ها بیشتر فشرده می شوند.

پس از انجام DCT ، این کافی نیست و CABAC برای فشرده سازی بدون ضرر مورد نیاز است.

کابین
فشرده سازی درون فریم فوق یک روش فشرده سازی با ضرر است. به عبارت دیگر ، پس از فشرده شدن تصویر ، نمی توان آن را به طور کامل بازیابی کرد. CABAC یک فناوری فشرده سازی بدون ضرر است.

فناوری فشرده سازی بدون از دست دادن ممکن است برای همه بیشتر آشنا باشد کدگذاری هافمن ، یک کد کوتاه برای کلمات با فرکانس بالا ، یک کد طولانی برای کلمات با فرکانس پایین برای رسیدن به هدف از فشرده سازی داده ها. VLC مورد استفاده در MPEG-2 این نوع الگوریتم است ، ما AZ را به عنوان مثال در نظر می گیریم ، A متعلق به داده های فرکانس بالا و Z متعلق به داده های فرکانس پایین است. ببینید چگونه انجام می شود

CABAC همچنین یک کد کوتاه برای داده های با فرکانس بالا و یک کد طولانی برای داده های با فرکانس پایین است. در عین حال ، بر اساس زمینه فشرده می شود ، که بسیار کارآمدتر از VLC است. اثر به شرح زیر است:

حالا AZ را با یک قاب فیلم جایگزین کنید ، و مانند زیر خواهد بود.

از تصویر بالا مشخص است که طرح فشرده سازی بدون تلفات با استفاده از CACBA بسیار کارآمدتر از VLC است.

خلاصه
در این مرحله ، ما اصل کدگذاری H264 را به پایان رسانده ایم. این مقاله به طور عمده در مورد نکات زیر صحبت می کند:
1. جیانین برخی مفاهیم اساسی را در H264 معرفی کرد. مانند قاب I / P / B ، GOP.
2. اصول اساسی کدگذاری H264 را با جزئیات توضیح دهید ، از جمله:

تقسیم بلوک ماکرو
گروه بندی تصویر
اصل تکنولوژی فشرده سازی درون قاب
اصل فن آوری فشرده سازی بین قاب.
DCT
اصل فشرده سازی CABAC.

چه حد (بلند) پوشش فرستنده؟

محدوده انتقال بستگی به عوامل بسیاری. فاصله واقعی بر روی آنتن نصب ارتفاع، آنتن است، با استفاده از محیط مانند ساختمان و مانع دیگر، حساسیت گیرنده، آنتن گیرنده. نصب و راه اندازی آنتن بالا و با استفاده از در حومه شهر، فاصله بسیار دور ها بیشتر خواهد شد.

مثال 5W فرستنده FM استفاده در شهرستان و محل تولد:

من یک USA استفاده مشتری 5W فرستنده FM با آنتن GP در زادگاه خود، و او آن را با یک ماشین، آن را پوشش 10km (6.21mile).

من تست فرستنده FM 5W با آنتن GP در زادگاه من، آن را در مورد 2km (1.24mile) را پوشش میدهد.

من تست فرستنده FM 5W با آنتن GP در شهرستان گوانگژو، آن را در مورد تنها 300meter (984ft) را پوشش میدهد.

در زیر محدوده تقریبی انتقال مختلف FM قدرت هستند. (محدوده قطر است)

0.1W ~ 5W فرستنده FM: 100M ~ 1KM

5W ~ 15W FM Ttransmitter: 1KM ~ 3KM

15W ~ 80W فرستنده FM: 3KM ~ 10KM

80W ~ 500W فرستنده FM: 10KM ~ 30KM

500W ~ 1000W فرستنده FM: 30KM ~ 50KM

1KW ~ 2KW فرستنده FM: 50KM ~ 100KM

2KW ~ 5KW فرستنده FM: 100KM ~ 150KM

5KW ~ 10KW فرستنده FM: 150KM ~ 200KM

چگونه با ما تماس بگیرید برای فرستنده؟

با من تماس + 8618078869184 OR
ایمیل من [ایمیل محافظت شده]
1.How حد شما می خواهید برای پوشش به قطر؟
2.How بلند شما برافراشتیم؟
3.Where هستی؟
و ما به شما مشاوره حرفه ای تر است.

درباره‌ ما

FMUSER.ORG یک شرکت ادغام سیستم است که با تمرکز بر روی تجهیزات رادیو و رادیو و رادیویی و پردازش داده های رادیویی و رادیویی رادیویی رادیویی است. ما از مشاوره و مشاوره از طریق یکپارچه سازی قفسه به نصب، راه اندازی و آموزش ارائه می کنیم.

ما ارائه دهنده فرستنده FM، فرستنده تلویزیون آنالوگ، فرستنده تلویزیون دیجیتال، فرستنده UHF VHF، آنتن، اتصالات کابل کواکسیال، STL، پردازش هوا، محصولات پخش برای استودیو، نظارت بر سیگنال RF، RDS رمزگذار، پردازنده های صوتی و واحد های کنترل از راه دور از راه دور، پروتکل های IPTV، ویدئو / صوتی / رمزگشایی، طراحی شده برای پاسخگویی به نیازهای هر دو شبکه بزرگ پخش بین المللی و ایستگاه های خصوصی کوچک به طور یکسان.

راه حل ما ایستگاه رادیویی FM / ایستگاه تلویزیونی آنالوگ / ایستگاه تلویزیونی دیجیتال / تجهیزات استودیوی ویدئو صوتی / پیوند دهنده انتقال استودیو / سیستم دورسنجی فرستنده / سیستم تلویزیون هتل / پخش زنده IPTV / پخش مستقیم پخش زنده / کنفرانس ویدیویی / سیستم پخش CATV است.

ما از محصولات فن آوری پیشرفته برای همه سیستم ها استفاده می کنیم، زیرا ما می دانیم قابلیت اطمینان بالا و عملکرد بالا برای سیستم و راه حل بسیار مهم است. در همان زمان ما همچنین باید مطمئن شوید که سیستم محصولات ما با قیمت بسیار مناسب است.

ما مشتریان پخش کننده های عمومی و تجاری، اپراتورهای مخابراتی و مقامات تنظیم را داریم، و ما نیز راه حل ها و محصولات را برای صدها تن از رسانه های کوچکتر، محلی و محلی ارائه می دهیم.

FMUSER.ORG بیش از 15 سال است که صادرات دارد و در سراسر جهان مشتری دارد. با 13 سال تجربه در این زمینه ، ما یک تیم حرفه ای برای حل انواع مشکلات مشتری داریم. ما در ارائه قیمت بسیار مناسب محصولات و خدمات حرفه ای اختصاص داده ایم. تماس با ایمیل : [ایمیل محافظت شده]

کارخانه ما

ما داریم نوسازی از کارخانه. شما خوش آمد به بازدید از کارخانه ما زمانی که شما به چین آمده است.

در حال حاضر، در حال حاضر وجود دارد مشتریان 1095 در سراسر جهان دفتر گوانگژو Tianhe ما بازدید کردند. اگر شما به چین آمده، به شما خوش آمد به ما مراجعه می کنند.

در نمایشگاه

این مشارکت ما در 2012 منابع جهانی است هنگ کنگ نمایشگاه الکترونیک . مشتریان از سراسر جهان در نهایت فرصتی برای با هم دارند.

FMUSER کجا است؟

شما می توانید این اعداد را جستجو کنید " 23.127460034623816,113.33224654197693 "در نقشه گوگل ، سپس می توانید دفتر fmuser ما را پیدا کنید.

دفتر FMUSER گوانگژو در Tianhe منطقه است که مرکز کانتون . بسیار نزدیک به نمایشگاه کانتون , ایستگاه راه آهن گوانگژو, جاده xiaobei و dashatou ، فقط نیاز دقیقه 10 اگر را TAXI . خوش آمدید دوستان در سراسر جهان به دیدار و مذاکره.

تماس با: آسمان آبی
تلفن همراه: + 8618078869184
واتساپ: + 8618078869184
Wechat: + 8618078869184
پست الکترونیک: [ایمیل محافظت شده]
QQ: 727926717
اسکایپ: sky198710021
آدرس: اتاق No.305 HuiLan ساختمان No.273 Huanpu جاده گوانگژو، چین پستی: 510620

انگلیسی: ما همه پرداخت ها از قبیل PayPal ، کارت اعتباری ، Western Union ، Alipay ، Money Bookers ، T / T ، LC ، DP ، DA ، OA ، Payoneer را می پذیریم ، اگر سؤالی دارید ، لطفا با من تماس بگیرید [ایمیل محافظت شده] یا WhatsApp + 8618078869184

پی پال. www.paypal.com

ما توصیه می کنیم شما با استفاده از پی پال به خرید اقلام ما، پی پال یک راه امن برای خرید در اینترنت است.

هر یک از لیست آیتم پایین صفحه ما در بالای لوگوی پی پال به پرداخت.

کارت اعتباری.اگر شما لازم نیست پی پال، اما شما باید کارت اعتباری، شما همچنین می توانید دکمه زرد پی پال به پرداخت با کارت اعتباری خود را کلیک کنید.

-------------------------------------------------- -------------------

اما اگر شما یک کارت اعتباری و یک حساب پی پال و یا مشکل به یک accout پی پال ندارد، شما می توانید زیر استفاده کنید:

اتحادیه غربی.

www.westernunion.com

پرداخت توسط وسترن یونیون به من:

نام / نام خانوادگی: Yingfeng
نام خانوادگی / نام خانوادگی / نام خانوادگی: ژانگ
نام کامل: یینگفنگ ژانگ
کشور: چین
شهرستان: گوانگژو

-------------------------------------------------- -------------------

T / T. پرداخت توسط T / T (انتقال سیم / انتقال تلگرافی / انتقال بانکی)

اولین اطلاعات بانکی (حساب شرکت):

SWIFT BIC: BKCHHKHHXXX
نام بانک: بانک چین (هنگ کنگ) محدود، هنگ کنگ
آدرس بانک: BANK OF TOWN CHINA، 1 GARDEN ROAD، CENTRAL، HONG KONG
کد بانکی: 012
نام حساب: FMUSER INTERNATIONAL GROUP LIMITED
شماره حساب. : 012-676-2-007855-0

-------------------------------------------------- -------------------
اطلاعات بانک دوم (حساب شرکت):
ذینفع: گروه بین المللی Fmuser
شماره حساب: 44050158090900000337
بانک ذینفع: بانک ساخت و ساز چین شعبه گوانگدونگ
کد SWIFT: PCBCCNBJGDX
آدرس: NO.553 Tianhe Road ، گوانگژو ، گوانگدونگ ، منطقه تیانه ، چین
** توجه: هنگامی که پول را به حساب بانکی ما منتقل می کنید ، لطفاً در قسمت یادداشت چیزی ننویسید ، در غیر این صورت به دلیل سیاست دولت در تجارت بین المللی ، قادر به دریافت پرداخت نخواهیم بود.

* آن خواهد شد در 1-2 روز کاری زمانی که پرداخت آشکار فرستادیم،.

* ما آن را به آدرس پی پال خود را ارسال خواهد کرد. اگر شما می خواهید به تغییر آدرس، لطفا آدرس صحیح و شماره تلفن خود را به ایمیل من ارسال [ایمیل محافظت شده]

* اگر بسته های زیر 2kg، ما از طریق پست هوایی حمل می شود، آن را در مورد 15-25days به دست خود را.

اگر بسته بیش از 2kg است، ما را از طریق EMS، DHL، UPS کشتی، فدرال اکسپرس تحویل سریع اکسپرس، آن را در مورد 7 15days به دست خود را ~.

اگر بسته بیش از 100kg، ما را از طریق DHL و یا حمل و نقل هوایی ارسال می کند. آن را در مورد 3 7days به دست خود را ~.

تمام بسته های فرم گوانگژو چین.

* بسته به عنوان "هدیه" ارسال می شود و در کمترین زمان ممکن اعلام می کند ، خریدار نیازی به پرداخت هزینه "TAX" ندارد.

* پس از کشتی، ما به شما یک ایمیل ارسال کنید و شما شماره پیگیری بدهد.

برای گارانتی
تماس با ما --- >> مورد را به ما برگردانید --- >> جایگزین دیگری را دریافت و ارسال کنید.

نام: لیو شایئوشی
آدرس: 305Fang HuiLanGe HuangPuDaDaoXi 273Hao TianHeQu گوانگژو چین.
پستی: 510620
تلفن: + 8618078869184

لطفا به این آدرس برگشت و ارسال آدرس پی پال، نام، مشکل خود را در توجه داشته باشید: