• 1 رای - 5 میانگین
  • 1
  • 2
  • 3
  • 4
  • 5
تبديل متن word به html
#1
با سلام به دوستان و اساتيد محترم
من مي خوام محتويات يك فايل Word رو با قابل HTML در دييتابيسم ذخيره كنم .
براي تبديل كردنش به HTML مشكلي ندارم مشكل اينجاست كه موقع تبديل كردن متن Word يكسري كدها و Style هاي اضافي هم به متن HTML اضافه مي شه از اونجا كه مي خوام اين متنو در ديتابيس ذخيره كنم ، كدهاي اضافي حجمي زيادي رو اشغال مي كنند آيا راهي هست كه بشه اين كدهاي اضافي مخصوصا Style ها را حذف كرد
ممنون مي شم اگه دوستان منو راهنمايي كنند...
  پاسخ
تشکر شده توسط :
#2
سلام،
چند تا می خواین؟ 999 تا خوبه: Smile
http://www.google.com/search?hl=en&q=PHP...gle+Search
وبلاگ: Yousha.Blog.ir

صدام: "اگر با ارتش شاه ایران طرف بودیم، یک ماهه جنگ را می بردیم"
http://gulfnews.com/opinion/thinkers/ira...i-1.500997
  پاسخ
تشکر شده توسط :
#3
سلام
Y.P.Y عزيز يه دونشم برام كفايت ميكنه Wink

قبلا من سرچ كردم بودم و اكثرانشو تست كردم

نقل قول:براي تبديل كردنش به HTML مشكلي ندارم مشكل اينجاست كه موقع تبديل كردن متن Word يكسري كدها و Style هاي اضافي هم به متن HTML اضافه مي شه از اونجا كه مي خوام اين متنو در ديتابيس ذخيره كنم ، كدهاي اضافي حجمي زيادي رو اشغال مي كنند آيا راهي هست كه بشه اين كدهاي اضافي مخصوصا Style ها را حذف كرد
  پاسخ
تشکر شده توسط :
#4
خب از توابع String parse یا Regular exp. استفاده کنید.
یک نمونش رو هم در اینجا ضمیمه کنید. Smile
وبلاگ: Yousha.Blog.ir

صدام: "اگر با ارتش شاه ایران طرف بودیم، یک ماهه جنگ را می بردیم"
http://gulfnews.com/opinion/thinkers/ira...i-1.500997
  پاسخ
تشکر شده توسط : mehdi_bahari_63
#5
من به عنوان مثال، خبر صفحه اول سايت ايران پي اچ پي را بصورت Word در آوردم كه پس از تبديل به HTML در نرم افزار FrontPage اونهم بصورت Copy ، Paste بصورت فايلHTML ضميمه در آمده است.
اگر فايل HTML رو باز كنيد علاوه بر متن مورد نظر يكسري كدهاي Style و ... نيز به فايل اضافه شده است و در صورتي كه حجم فايل ورد زياد باشد با تبديل كردن به HTML با حجم انبوهي از اين كدهاي اضافي روبرو خواهيم شد.

البته من در اين مثال بصورت كپي و پيست اين كار انجام داده ام و از هر نرم افزار Convert ي كه استفاده كرده ام همين مشكل را داشت.


فایل‌های پیوست
.doc   Chrome.doc (اندازه 27 KB / تعداد دانلود: 5)
.htm   Chrome.htm (اندازه 6.29 KB / تعداد دانلود: 7)
  پاسخ
تشکر شده توسط : Y.P.Y
#6
ساده تر از این؟:
اینکه وقتی شما تبدیل رو انجام میدید یک Strip_Tags بزنید هیچ کد اضافی نخواهید داشت. Text خالص.
ولی اگر Style نداشته باشه پس HTML بودنش چه فایده؟
وبلاگ: Yousha.Blog.ir

صدام: "اگر با ارتش شاه ایران طرف بودیم، یک ماهه جنگ را می بردیم"
http://gulfnews.com/opinion/thinkers/ira...i-1.500997
  پاسخ
تشکر شده توسط : mehdi_bahari_63
#7
خوب دوست عزیز وقتی شما متنتون رو در word طراحی می کنید، مثلا رنگ به عنوان مطلب میدید، موقع کپی ما که نمیبینیم چی کپی میشه! ولی این مسلمه که هرچی هست و نیست کپی میشه و به سیستم داده میشه. من همیشه برای اینکار، اول در ورد میریختم و بعد در notepad پیست میکردم که تمامی کد هاش از بین بره.
غایب
  پاسخ
تشکر شده توسط : mehdi_bahari_63
#8
دوستان ببخشيد اگه من نتونستم كاملا منظورم رو برسونم سعي مي كنم منظورم رو با اين مثال بطور كامل بيان كنم:
کد پی‌اچ‌پی:
<class="MsoNormal" dir="RTL" style="text-align: justify; text-justify: kashida; text-kashida: 0%">
<
span lang="AR-SA" style="font-family: B Mitra">این سیستم عامل که</span><span lang="AR-SA">&nbsp;</span><span lang="AR-SA" style="font-family: B Mitra">درحال 
حاضر
</span><span lang="AR-SA">&nbsp;</span><span lang="AR-SA" style="font-family: B Mitra"></span><span dir="LTR">Google 
Chrome OS
</span><span lang="AR-SA" style="font-family: B Mitra">” نام گذاری شده 
است به صورت کد باز بوده و سیستم عاملی بسیار سبک است که جهت نصب در نت بوک ها 
(</span><span dir="LTR">Netbook</span><span lang="AR-SA" style="font-family: B Mitra">) 
بسیار مناسب می باشدگوگل قصد دارد تا اواخر سال جاری کد نویسی این سیستم عامل را 
به پایان برساند و پس از آن در سال 
</span>
<
span lang="FA" style="font-family: B Mitra">۲۰۱۰</span><span lang="AR-SA" style="font-family: B Mitra"
یک نت بوک مجهز به نرم افزارهای خود را معرفی نمایدهمچنین، گوگل تائید کرده است 
که سیستم عامل 
</span><span dir="LTR">Google Chrome OS</span><span lang="AR-SA" style="font-family: B Mitra"
قابلیت اجرا بر روی چیپست های </span><span dir="LTR">x86</span><span lang="AR-SA" style="font-family: B Mitra"
و </span><span dir="LTR">ARM</span><span lang="AR-SA" style="font-family: B Mitra"
را دارا می باشد.</span></p

متن فوق كد HTML اي است كه بعد از كانورت كردن به اين شكل در آمده است حالا من مي خوام با استفاد از يك نرم افزار يا ترفندي بتونم به شكل كد زير در بياورم

کد پی‌اچ‌پی:
<p>
این سیستم عامل که&nbsp;درحال حاضر&nbsp;Google Chrome OS نام گذاری شده 
است به صورت کد باز بوده و سیستم عاملی بسیار سبک است که جهت نصب در نت بوک ها 
(Netbook
بسیار مناسب می باشدگوگل قصد دارد تا اواخر سال جاری کد نویسی این سیستم عامل را 
به پایان برساند و پس از آن در سال ۲۰۱۰ 
یک نت بوک مجهز به نرم افزارهای خود را معرفی نماید
همچنین، گوگل تائید کرده است 
که سیستم عامل Google Chrome OS 
قابلیت اجرا بر روی چیپست های x86 
و ARM 
را دارا می باشد
.</p



اگر توجه كرده باشيد تمامي كدهاي Html در كد دوم حذف نشده مثل تگ <p> و در عوض كدهاي اضافي مثل <span> كاملا حذف شده است .
اگر قرار باشه اين كار رو بصورت دستي انجام بدم موقعي كه متن زياده با مشكل مواجه مي شم .

نقل قول:اینکه وقتی شما تبدیل رو انجام میدید یک Strip_Tags بزنید هیچ کد اضافی نخواهید داشت. Text خالص.

Text خالص به دردم نمي خوره در واقع مي خوام تگ هاي اضافي كه نبودنش خيلي تاثيري در نمايش متن نداره كاملا حذف بشه

نقل قول:من همیشه برای اینکار، اول در ورد میریختم و بعد در notepad پیست میکردم که تمامی کد هاش از بین بره.

درسته اين زمانيه كه شما متن خالص رو بخواهيد ولي اگر در متنتو جدول داشته باشيد و داخل Notepad بريزيد اونوقت همه متن هاتون پشت سرم درج مي شوند و اون ترتيبي كه در جدول داشتند رو از دست مي ده

اميدوارم كه تونسته باشم منظورم رو كاملا بيام كنم
  پاسخ
تشکر شده توسط :
#9
اگه نرم افزار نباشه برای این کار بهتره خودتون با PHP یک چیزی بنویسید که بجای این تگ ها مثلا فاصله replace بشه.
غایب
  پاسخ
تشکر شده توسط :
#10
http://us.php.net/strip_tags

یه کم دقت کن
این تابع به شما اجازه می ده که فقط تگ های مشخصی رو در متن قرار بدید
همه جوره اش رو داریم ظاهرن
  پاسخ
تشکر شده توسط :


پرش به انجمن:


کاربران در حال بازدید این موضوع: 1 مهمان