Mozaik.

21 Aug, 2009

E-časopis

Posted by: Urban In: razno

Turk piše o novem projektu pregledovalnika slovenskih časopisov. Malo me moti klikanje next next, pa sem dobil idejo, da uporabim MegaZine, ki je čista odličnost.

Ratalo je tole e-delo. Na kakšni strani sicer kaj manjka, zaradi nekega buga v GhostScriptu1. Zadeva se osvežuje vsako jutro.

Izkaže se, da je za branje vseeno preveč nerodno. Lista se super, tudi s tipkama levo in desno, če ti je stran zanimiva klikneš zoom in greš v full screen (vendar potem listanje ni možno dokler ne pritisneš ESC), ko pa si v polnozaslonskem načinu pa lahko s koleščkom zoomaš in se z miško premikaš po listu.

blog_delo

Update: Dare je razvil storitev, ki vse PDF-je iz Delovega sajta zlepi v en PDF. Uporabno in prijazno za listat.

  1. ne dela niti v 8.15, niti v zadnjem 8.64, niti na Oknih, na teh neregularnih straneh pdfja pa failajo tudi vsi online converterji, ki sem jih probal []

20 Aug, 2009

Netflixova kultura

Posted by: Urban In: razno

Vredno branja; Netflix ima tržno kapitalizacijo $2.5B in je samo ene 50x manjši od Googla/Appla/Cisca.

Njihov “pravilnik” za stroške, potovanja in darila je dolg 5 besed:
Vedno ravnaj v interesu Netflixa.

13 Jul, 2009

Jim Rohn – Personal Development

Posted by: Urban In: razno

Trikrat sem probal, pa ga nisem mogel objavit v Google readerju, zato postam tu. Reader ma probleme z embedanjem. :|

Hecen je tale Jim Rohn, ampak ma naštudiran act. Nisem ga poznal, Aleš mi je povedal da je bil mentor Tonya Robbinsa1 in Briana Tracya. Wikipedija se strinja.

14 minut, priporočam.

Jim Rohn -Personal Development

  1. say “Aye”! []

04 Jul, 2009

Google je “DNS za content”

Posted by: Urban In: razno| web dev

DNS je telefonski imenik interneta in omogoča preslikavo domene na IP naslov. Zaradi DNS-a je spletna stran lahko dosegljiva na istem naslovu (domeni) ne glede na spremembe IP naslova dejanskega strežnika. Če se IP naslov spremeni, je potrebno le popraviti vnos v DNS-u. Podobno, kot če spremenimo telefonsko številko in zahtevamo spremembo v telefonskem imeniku. DNS tako zagotavlja imunost na spremembe IP naslovov.

Kaj pa, če se spremeni domena? Če naslov neke strani shranimo kot bookmark, kasneje pa se vrnemo in stara domena ne obstaja več? Analogija bi bila, da si spremenimo ime in nas ljudje v telefonskem imeniku ne morejo več najti. To se na spletu pogosto dogaja in sprašujem se, koliko od mojih bookmarkov na delicious.com še kaže na prave strani.

Pravkar sem z Googlom našel novo lokacijo ene takšne preimenovane strani — z iskanjem po njeni vsebini. Ali so domene sploh še pomembne, če lahko stran z iskanjem po vsebini najdemo prej, kot lahko najdemo svoj bookmark (ali celo prej, kot če bi naslov natipkali po spominu)?

Če je vsebina sama tista nespremenljiva esenca strani (torej to, kar naj bi bil že njen URI), potem Google zagotavlja imunost na spremembe domen (oz. neke vrste DNS za vsebino), ta blog post pa se bo dalo najti z iskanjem za “nespremenljiva esenca strani” dokler bo obstajal kjerkoli na netu.

11 Jun, 2009

Dilbert iskalnik

Posted by: Urban In: programiranje

Rad čitam Dilbert stripe, ker tu pa tam zadanejo žebljico na glavico. Nekaj časa sem si ta boljše shranjeval, našel pa nikoli točno tistega, ki bi ilustriral kakšno še posebej absurdno situacijo. V takih trenutkih sem si želel storitve, v kateri bi lahko brskal po arhivu in iskal stripe po tekstu in junakih.

Ko sem pred časom preverjal, se tega še ni dalo, zato sem se napravil zadevo narediti sam. Danes obstajata že 2 podobna sajta (pa jih žal ne znam uporabljat — mogoče sta namenoma prekomplicirana, da preveč očitno ne kršita pravic), spodaj pa opisujem svoj poskus, ki sem se ga lotil že dolgo nazaj.

Izhajal sem iz arhiva sličic, ki ga nekdo pridno fila. K sebi sem zložil vse slike in se namenil na njih narediti OCR. To je dokaj težko, ker je resolucija slaba, font pa majhen in na roko napisane sorte. Sprobal sem cel kup komercialnih in nekomercialnih OCR-ov (tudi tesseract, ki se je obnesel porazno). Za silo sprejemljiive rezultate sem dobil z Microsoft Office Document imaging OCR, ki je del Offica, in se ga da kontrolirati tudi softversko. Na hitro sem zložil skupaj par vrstic VB6 kode in zakrožil po slikah.

Private Sub Command1_Click()

  Dim miDoc As MODI.Document
  Dim File As String

  sPath = "f:dilbert"
  File = Dir$(sPath & "*.jpg")
  Do While Len(File)
      Label1.Caption = "Processing " & File
      DoEvents
      Set miDoc = New MODI.Document
      miDoc.Create sPath & File
      miDoc.OCR MODI.MiLANGUAGES.miLANG_ENGLISH, False, True
      Open sPath & File & ".txt" For Output As #1
      Print #1, miDoc.Images(0).Layout.Text
      Close #1
      File = Dir$
  Loop
  Label1.Caption = "Finished"
End Sub

Da bi izboljšal rezultate, sem poskusil po FBI-jevsko izboljšati kvaliteto slike. Naredil sem Photoshop akcijo, ki je povečala velikost in nato naredila sharpen, za nameček pa še spremenila vodoraven strip v navpično postavitev. Akcijo sem uporabil na celem direktoriju (z manjšimi problemi pri določanju imen izhodnih datotek), nato pa še enkrat naredil OCR.

Rezultat je bil mnogo boljši, ampak še vedno s precej napakami. Obupal sem in raje poiskal user-generated transkripte in jih napopal v bazo kot dodaten stolpec. Voilà.


  • Roman: Si me spomnil kako hudo je stare sci revije brat. :) Na racun res neskoncnih arhivov knjig sem pripravljen zamenjat obcutek papirja v rokah. Verjet
  • Tapuwenec: This thing already flying retin a wrinkle last drop out when
  • dare: zx spectrum FTW!

About


Researcher at FE, LTFE, programmer, photographer,
technology enthusiast, etc.

See what I share on Google Reader, and elsewhere.

Zadnje s fotobloga

Trails in the Snow Reeds Upwards A book and a match Checkered Building Coca-Cola Zero