دسته بندی | کامپیوتر |
بازدید ها | 35 |
فرمت فایل | doc |
حجم فایل | 4210 کیلو بایت |
تعداد صفحات فایل | 18 |
IEEE-ICB 2015
Multi-label CNN Based Pedestrian Attribute Learning for Soft Biometrics
Abstract
Recently, pedestrian attributes like gender, age and
clothing etc., have been used as soft biometric traits for recognizing
people. Unlike existing methods that assume the
independence of attributes during their prediction, we propose
a multi-label convolutional neural network (MLCNN)
to predict multiple attributes together in a unified framework.
Firstly, a pedestrian image is roughly divided into
multiple overlapping body parts, which are simultaneously
integrated in the multi-label convolutional neural network.
Secondly, these parts are filtered independently and aggregated
in the cost layer. The cost function is a combination
of multiple binary attribute classification cost functions.
Moreover, we propose an attribute assisted person reidentification
method, which fuses attribute distances and
low-level feature distances between pairs of person images
to improve person re-identification performance. Extensive
experiments show: 1) the average attribute classification
accuracy of the proposed method is 5.2% and 9.3% higher
than the SVM-based method on three public databases,
VIPeR and GRID, respectively; 2) the proposed attribute assisted
person re-identification method is superior to existing
approaches.
یادگیری مشخصه ی عابر پیاده براساس CNN چند برچسبی برای بیومتریک نرم
چکیده
به تازگی، ویژگیهای عابر پیاده مثل جنس، سن و لباس و غیره، بهعنوان صفات بیومتریک نرم برای شناختن افراد استفاده شدهاند. برخلاف روشهای موجود که استقلال ویژگیها را در طول پیشبینی آنها در نظر میگیرد، یک شبکهی عصبی پیچیده چند برچسبی (MLCNN) را به منظور پیشبینی مشخصات متعدد همراه با هم در چارچوب یکپارچه ارائه میکنیم. ابتدا، تصویر عابر پیاده تقریبا به چند بخش همپوشانیکنندهی بدن تقسیم میشود، که بطور همزمان در شبکه عصبی پیچیدهی چند برچسبی ادغام میشوند. در مرحلهی دوم، این بخشها بطور مستقل در لایهی هزینه فیلتر و طبقهبندی میشوند. تابع هزینه ترکیبی از چند تابع هزینهی طبقهبندی ویژگی دودویی است. علاوه بر این، روش باز شناسایی شخص به کمک ویژگی را ارائه میکنیم، که فواصل ویژگی و فواصل ویژگی سطح پایین را بین جفت تصاویر فرد به منظور بهبود عملکرد بازشناسایی فرد ترکیب میکند. آزمایشهای گسترده نشان میدهند: 1) میانگین دقت طبقهبندی ویژگی روش ارائه شده به ترتیب 5.2% و 9.3% بیشتر از روش مبتنی بر SVM در سه پایگاه داده عمومی، VIPeR و GRID است، 2) روش پیشنهادی بازشناسایی فرد به کمک ویژگی نسبت به روشهای دیگر برتری دارد.
یادگیری مشخصهی عابر پیاده براساس CNN چند برچسبی برای بیومتریک نرم
چکیده
به تازگی، ویژگیهای عابر پیاده مثل جنس، سن و لباس و غیره، بهعنوان صفات بیومتریک نرم برای شناختن افراد استفاده شدهاند. برخلاف روشهای موجود که استقلال ویژگیها را در طول پیشبینی آنها در نظر میگیرد، یک شبکهی عصبی پیچیده چند برچسبی (MLCNN ) را به منظور پیشبینی مشخصات متعدد همراه با هم در چارچوب یکپارچه ارائه میکنیم. ابتدا، تصویر عابر پیاده تقریبا به چند بخش همپوشانیکنندهی بدن تقسیم میشود، که بطور همزمان در شبکه عصبی پیچیدهی چند برچسبی ادغام میشوند. در مرحلهی دوم، این بخشها بطور مستقل در لایهی هزینه فیلتر و طبقهبندی میشوند. تابع هزینه ترکیبی از چند تابع هزینهی طبقهبندی ویژگی دودویی است. علاوه بر این، روش باز شناسایی شخص به کمک ویژگی را ارائه میکنیم، که فواصل ویژگی و فواصل ویژگی سطح پایین را بین جفت تصاویر فرد به منظور بهبود عملکرد بازشناسایی فرد ترکیب میکند. آزمایشهای گسترده نشان میدهند: 1) میانگین دقت طبقهبندی ویژگی روش ارائه شده به ترتیب 5.2% و 9.3% بیشتر از روش مبتنی بر SVM در سه پایگاه داده عمومی، VIPeR و GRID است، 2) روش پیشنهادی بازشناسایی فرد به کمک ویژگی نسبت به روشهای دیگر برتری دارد.
دسته بندی | برق ، الکترونیک و مخابرات |
بازدید ها | 13 |
فرمت فایل | |
حجم فایل | 1896 کیلو بایت |
تعداد صفحات فایل | 17 |
کنترل پیش بین مدل بدلیل توانایی دخالت دادن قیدهای حاکم بر پلانت در هنگام محاسبه سیگنال های کنترلی، یکی از استراتژی های بالقوه در کنترل فرآیندهای صنعتی است. عیب بزرگی که کنترل پیش بین مدل دارد این است که باید مدل دقیقی از پلانت وجود داشته باشد تا بر اساس آن پیش بینی سیستم درست انجام شده در در نهایت با بهینه سازی بلادرنگ سیگنال های کنترلی در زمان های آینده، با دقت محاسبه شود. اما مدلسازی فرآیند های صنعتی پیچیده و غیرخطی با استفاده از روش های کلاسیک ممکن است جوابگو نباشد و باید دنبال راهی بود که بتواند دینامیک پلانت را بخوبی مدل کند و قابلیت یادگیری هم داشته باشد.
امروزه شبکه های عصبی جایگاه ویژه ای برای مدلسازی و کنترل فرآیند های صنعتی پیچیده پیدا کرده است. چرا که این شبکه ها هم قادر هستند، پیچیده ترین پلانت های غیرخطی را مدلسازی کنند و هم قابلیت یادگیری هم دارند یعنی می توانند از ورودی های جدیدی که به پلانت وارد می شوند، برای بهبود مدل عصبی استفاده کنند. در این پروژه یک پلانت غیرخطی درنظر می گیریم و سپس با مدلسازی عصبی و بهینه سازی بلادرنگ با استفاده از کنترل پیش بین مدل، پلانت را کنترل می کنیم.