• 0 رای - 0 میانگین
  • 1
  • 2
  • 3
  • 4
  • 5
مشکل در تشخیص زبان فارسی با استفاده از regex
#1
من از رجیکس زیر استفاده می کنم ولی موقعی که در متن فارسی از اعداد انگلیسی استفاده می کنیم متن رو انگلیسی فرض می کنه:
کد پی‌اچ‌پی:
preg_match('/^[\s\x{0600}-\x{06FF}0-9]*$/u'$msg$match
لطفا کمکم کنید
  پاسخ
تشکر شده توسط :
#2
پاسخی نبود؟
  پاسخ
تشکر شده توسط :
#3
چرا می خوای از regex استفاده کنی
strlen و mb_strlen کنار هم خیلی راحت می تونن تشخیص بدن
  پاسخ
تشکر شده توسط :
#4
مطمئنی؟! فکر نکنم ربطی داشته باشه
اگه حق با تو باشه یه مثال بیار
  پاسخ
تشکر شده توسط :
#5
کد پی‌اچ‌پی:
if(mb_strlen($str))!=strlen($mb)
{
//this is utf-8
..
.


البته واسه برررسی utf-8 بودن هست
  پاسخ
تشکر شده توسط :
#6
(۱۳۸۹ بهمن ۱۰, ۰۲:۴۲ ب.ظ)admin نوشته:
کد پی‌اچ‌پی:
if(mb_strlen($str))!=strlen($mb)
{
//this is utf-8
..
.


البته واسه برررسی utf-8 بودن هست

رجکس کامل:
/([^\x00-\xFF]\s*)/u
  پاسخ
تشکر شده توسط :


پرش به انجمن:


کاربران در حال بازدید این موضوع: 1 مهمان