Updates from Urban Toggle Comment Threads | Keyboard Shortcuts

  • Urban 22:58 on 13 Jul. 2009 Permalink |  

    Jim Rohn – Personal Development 

    Trikrat sem probal, pa ga nisem mogel objavit v Google readerju, zato postam tu. Reader ma probleme z embedanjem. 😐

    Hecen je tale Jim Rohn, ampak ma naštudiran act. Nisem ga poznal, Aleš mi je povedal da je bil mentor Tonya Robbinsa1 in Briana Tracya. Wikipedija se strinja.

    14 minut, priporočam.

    Jim Rohn -Personal Development

    1. say “Aye”! []
     
  • Urban 23:53 on 4 Jul. 2009 Permalink |  

    Google je “DNS za content” 

    DNS je telefonski imenik interneta in omogoča preslikavo domene na IP naslov. Zaradi DNS-a je spletna stran lahko dosegljiva na istem naslovu (domeni) ne glede na spremembe IP naslova dejanskega strežnika. Če se IP naslov spremeni, je potrebno le popraviti vnos v DNS-u. Podobno, kot če spremenimo telefonsko številko in zahtevamo spremembo v telefonskem imeniku. DNS tako zagotavlja imunost na spremembe IP naslovov.

    Kaj pa, če se spremeni domena? Če naslov neke strani shranimo kot bookmark, kasneje pa se vrnemo in stara domena ne obstaja več? Analogija bi bila, da si spremenimo ime in nas ljudje v telefonskem imeniku ne morejo več najti. To se na spletu pogosto dogaja in sprašujem se, koliko od mojih bookmarkov na delicious.com še kaže na prave strani.

    Pravkar sem z Googlom našel novo lokacijo ene takšne preimenovane strani — z iskanjem po njeni vsebini. Ali so domene sploh še pomembne, če lahko stran z iskanjem po vsebini najdemo prej, kot lahko najdemo svoj bookmark (ali celo prej, kot če bi naslov natipkali po spominu)?

    Če je vsebina sama tista nespremenljiva esenca strani (torej to, kar naj bi bil že njen URI), potem Google zagotavlja imunost na spremembe domen (oz. neke vrste DNS za vsebino), ta blog post pa se bo dalo najti z iskanjem za “nespremenljiva esenca strani” dokler bo obstajal kjerkoli na netu.

     
  • Urban 22:38 on 11 Jun. 2009 Permalink |  

    Dilbert iskalnik 

    Rad čitam Dilbert stripe, ker tu pa tam zadanejo žebljico na glavico. Nekaj časa sem si ta boljše shranjeval, našel pa nikoli točno tistega, ki bi ilustriral kakšno še posebej absurdno situacijo. V takih trenutkih sem si želel storitve, v kateri bi lahko brskal po arhivu in iskal stripe po tekstu in junakih.

    Ko sem pred časom preverjal, se tega še ni dalo, zato sem se napravil zadevo narediti sam. Danes obstajata že 2 podobna sajta (pa jih žal ne znam uporabljat — mogoče sta namenoma prekomplicirana, da preveč očitno ne kršita pravic), spodaj pa opisujem svoj poskus, ki sem se ga lotil že dolgo nazaj.

    Izhajal sem iz arhiva sličic, ki ga nekdo pridno fila. K sebi sem zložil vse slike in se namenil na njih narediti OCR. To je dokaj težko, ker je resolucija slaba, font pa majhen in na roko napisane sorte. Sprobal sem cel kup komercialnih in nekomercialnih OCR-ov (tudi tesseract, ki se je obnesel porazno). Za silo sprejemljiive rezultate sem dobil z Microsoft Office Document imaging OCR, ki je del Offica, in se ga da kontrolirati tudi softversko. Na hitro sem zložil skupaj par vrstic VB6 kode in zakrožil po slikah.

    Private Sub Command1_Click()
     
      Dim miDoc As MODI.Document
      Dim File As String
      
      sPath = "f:dilbert"
      File = Dir$(sPath & "*.jpg")
      Do While Len(File)
          Label1.Caption = "Processing " & File
          DoEvents
          Set miDoc = New MODI.Document
          miDoc.Create sPath & File
          miDoc.OCR MODI.MiLANGUAGES.miLANG_ENGLISH, False, True
          Open sPath & File & ".txt" For Output As #1
          Print #1, miDoc.Images(0).Layout.Text
          Close #1
          File = Dir$
      Loop
      Label1.Caption = "Finished"
    End Sub
    

    Da bi izboljšal rezultate, sem poskusil po FBI-jevsko izboljšati kvaliteto slike. Naredil sem Photoshop akcijo, ki je povečala velikost in nato naredila sharpen, za nameček pa še spremenila vodoraven strip v navpično postavitev. Akcijo sem uporabil na celem direktoriju (z manjšimi problemi pri določanju imen izhodnih datotek), nato pa še enkrat naredil OCR.

    Rezultat je bil mnogo boljši, ampak še vedno s precej napakami. Obupal sem in raje poiskal user-generated transkripte in jih napopal v bazo kot dodaten stolpec. Voilà.

     
  • Urban 01:07 on 2 Jun. 2009 Permalink |  

    Processing.org testna vožnja 

    Dostikrat sem že videl hude vizualizacije, narejene s Processing.org, čez vikend pa sem zadevo tudi sam probal. In huda je.

    Primeri, ki so v distribuciji, pokrivajo vse od 2D in 3D animacij, do zajema in vizualizacije zvoka in manipulacije videa. Na neodvisnem sajtu OpenProcessing.org pa najdemo javen repozitorij številnih dobrih vizualizacij/animacij s pripadajočo kodo.

    Processing je osnovan na Javi, zato pišemo javansko kodo. Na voljo pa je cel kup konstruktov, specifičnih za vizualizacijo, kar zelo poenostavi programiranje. Rezultat se dá exportati kot applet (tole spodaj) ali kot Java-based executable aplikacijo za Win/Linux/MacOS.

    Tale je čisto moj, rezultat parurnega eksperimentiranja.
    (Klikni za štart, oviro pa lahko premikaš z miško.)

    This browser does not have a Java Plug-in.
    Get the latest Java Plug-in here.

     
    • dare 14:01 on 2 Jun. 2009 Permalink

      hudo! sam neki maš čudno fiziko…

      če postaviš kroglo nad tok (tako da gre vse mimo), potem jo pa potegneš dol v tok, špricne mal partiklov z zgornjega dela krogle v random smeri 🙂

    • Urban 23:57 on 2 Jun. 2009 Permalink

      Ja res je.. premikanje krogle ni blo planirano, dodal sm ga za foro, k sm pogruntal da sta samo 2 dodatni vrstici in da je dobr efekt… Problem je, da se premik kugle zgodi tko hitro, da se ta dejansko pojavi na mestu kjer so že particli (torej collision), in takrat jih moj lame mehanizem replaya nazaj dokler niso zunaj krogle. Nepredvidljiv prehodni pojav pač 🙂

  • Urban 01:33 on 22 May. 2009 Permalink |  

    Movie Word Cloud 

    I’ve calculated the word frequency in the subtitles of about 40k English movies. I thought I’d get something useful, but can’t see it yet. Listing highest ranking words proved almost entirely useless, so I excluded the most common stop-words. Here I listed the highest 500 ranking words.

    An interesting question here would be: is the relative frequency any different than the relative frequency in English language in general? What words have higher frequency in movies than in everyday language? Can we detect movie speak by the lack of certain words?

    wordcloud

    But what seems more promising than doing a simple word count is Yahoo term extractor which, surprisingly, does a pretty good job. For example, American Beauty yields these terms:

    • lester burnham
    • neighbor jim
    • pruning shears
    • product launch
    • lover jim
    • miracle gro
    • typical teenager
    • geek boy
    • daughter jane
    • wife carolyn
    • eggshells
    • role model
    • high point
    • clogs
    • misery
    • loser
    • girlfriend
    • honey
    • roses
    • dad

    In fact it’s almost as good as watching the movie 🙂 . That’s why the next step will be listing the most common Yahoo-extracted terms for all the movies. Gotta do it while Yahoo’s still around 🙂 .

    This bit of Ruby code queries Yahoo term extraction API (you need an API key first):

    require 'net/http'
    require 'rexml/document'
    
    app_id = '***************'
    yahoo_uri = URI.parse('http://api.search.yahoo.com/ContentAnalysisService/V1/termExtraction')
    
    resp = Net::HTTP.post_form(yahoo_uri, { 'appid' => app_id, 'context' => text  } )
    
    terms = REXML::Document.new resp.body
    
    terms.each_element("//Result") do |term| 
        puts term
    end
    
     
    • dare 17:22 on 22 May. 2009 Permalink

      hacking & sharing, pohvalno.

      fajn vizuelna prenova bloga!

    • dare 17:23 on 22 May. 2009 Permalink

      pa za boljšo sliko bi blo treba zmergat hear/heard, thing/things ipd.

    • Urban 17:57 on 24 May. 2009 Permalink

      prov maš.. stemming in lematizacija bi dost pomagala. sploh nism pomislu.

c
Compose new post
j
Next post/Next comment
k
Previous post/Previous comment
r
Reply
e
Edit
o
Show/Hide comments
t
Go to top
l
Go to login
h
Show/Hide help
shift + esc
Cancel