Webprofis is een Forum waarin je vragen kunt stellen die webgerelateerd zijn. Heb je vragen over of problemen met je Webpagina, HTML, CSS, Javascript, PHP of andere client of serverside scriptingtalen? Stel ze dan gerust op dit forum. Op dit forum zijn een aantal vrijwilligers actief die u graag met uw vragen willen helpen en u waar mogelijk een passend antwoord aanbieden. Hebt u zelf veel ervaring en kennis met betrekking tot het bovenstaande? U bent van harte welkom om uw kennis met anderen te delen!

We hopen dat eenieder op dit Forum een leerzame ervaring mag opdoen.

Team Webprofis

Vreemde tekens in zoekresultaat

bewerkt wo 17 jun 2015 in PHP, MySQL Posts: 44
Ik heb op http://www.verbodengeschriften.nl een zoekfunctie gemaakt met Search Enzine Composer. In de zoekresultaten pagina komen soms vreemde tekens voor, bv. als ik in het zoekvak "kanker" intik. Blijkbaar is ergens niet de juiste charset ingegeven. In Search Enzine Composer heb ik charset windows-1252 ingegeven, ook in de betreffende PHP-bestanden. Dit is dezelfde charset als in de pagina's die in het zoekresultaat wordt weergegeven, maar in die pagina's komen die vreemde tekens niet voor. Hoe vermijd ik de vreemde tekens uit de zoekresultaten?

P.S. Op de website van de maker vind ik niets hierover.

Reacties

  • Je gebruikt ook vreemde characters, dus ik zou sowieso overal voor UTF8 gaan, en let wel dat je dat overal doet, dus ook je database!
    Verder zie ik in je searchresults niet eens een charset?
  • bewerkt za 20 jun 2015
    PMPosts: 44
    Ik ben een paar dagen van de straat geweest door te onderzoeken hoe het kan worden voorkomen dat er op de zoekresultaten-pagina's op diverse plaatsen tekens niet goed worden weergegeven:

    image

    Het zijn maar schoonheidsfoutjes, maar toch. Ik heb navraag gedaan bij de provider, van alles geprobeerd en ten slotte andere zoekmachine software gekocht (Zoom Search Engine). Omdat ik beide zoekmachines (Zoom Search Engine en Search Enzine Composer) op de website heb ge??nstalleerd kon ik ze goed vergelijken. Ik heb uitgebreid geexperimenteerd, o.a. met de charsets.

    Oude zoekmachine: www.verbodengeschriften.nl#zoekfunctie
    Nieuwe zoekmachine (voorlopig niet ingebed in de website): www.verbodengeschriften.nl/zoom/search.php

    Conclusie:
    De oude zoekmachine geeft op de zoekresultatenpagina's het op de website weinig voorkomende Griekse en Cyrillische schrift niet goed weer, maar meestal wel de vaak voorkomende trema's, apostrofs, enkele en dubbele aanhalingstekens. De nieuwe zoekmachine geeft het Grieks en Cyrillisch goed weer, maar trema's, apostrofs, enkele en dubbele aanhalingstekens vaak niet. De nieuwe functioneert wel een beetje anders en het programma zelf heeft meer mogelijkheden. Ik geef de voorkeur aan de oude zoekmachine.
  • Dus je hebt nog niks wat 100% werkt zoals het hoort...

    Waarom niet utf-8, die ondersteund sowieso grieks en cyrillic e.v.a...
    Let wel dat je je charset over je hele meuk hetzelfde is, anders krijg je inderdaad dat sommige dingen goed en sommige dingen fout gaan.
  • bewerkt zo 21 jun 2015
    PMPosts: 44
    Utf-8 in html-pagina's geeft inderdaad voor die pagina's Grieks en Cyrillisch goed weer, maar alle trema's, apostrofs, enkele en dubbele aanhalingstekens niet. De betreffende website is in een tijdsperiode van vele jaren ontstaan en telt inmiddels 385 pagina's en veel daarvan hebben verschillende charsets (iso-8859-1 of windows-1252 of utf-8). Allemaal nalopen en veranderen is een megaklus en bovendien ben ik er niet zeker van of dat de oplossing is, want ik heb geexperimenteerd met zowel verschillende charsets voor de zoekprogramma's als voor een aantal html-documenten, maar vond geen oplossing. Experimenteren met wat het beste is is extra bewerkelijk doordat het bouwen en uploaden van een nieuwe database tien minuten duurt. Een punt is ook, dat mijn html-editor automatisch de charset kiest en als ik dan weleens verkeerde tekens kreeg experimenteerde ik met iso-8859-1, windows-1252 en utf-8 totdat het goed was - zo zijn de verschillen ontstaan.
Login of Registreer om te reageren.