MICHAŁ FURA

Wydawcy prasy skarżą się na kradzież ich treści przez serwisy internetowe, które bagatelizują sprawę. Pana firma na zlecenie wydawców (m.in. wydawcy Dziennika Gazety Prawnej) szuka w sieci serwisów, które nielegalnie wykorzystują ich artykuły. Jaka jest rzeczywiście skala tego zjawiska?

SEBASTIAN KAWCZYŃSKI*

Ogromna. Gdy zaczęliśmy pracę dla jednego z wydawców, najpierw przeszukiwaliśmy internet pod kątem serwisów, które wykorzystywały jego artykuły w co najmniej 30 proc. Było ich jednak tak dużo, że zmieniliśmy parametry i zaczęliśmy wybierać tylko te serwisy, które wykorzystywały co najmniej 50 proc. oryginalnego tekstu, ale i w tym przypadku okazało się, że liczba takich serwisów jest wciąż ogromna, idąca w setki. Do właściciela każdego z takich serwisów wydawca wysyłał potem wezwanie do zaprzestania działalności lub pozew o odszkodowanie, więc ich liczba ma znaczenie. Dlatego ostatecznie ograniczyliśmy zakres przeszukiwania tylko do tych miejsc, które wykorzystują teksty w co najmniej 70 proc.

>>> Czytaj też: "Wydawcy prasowi prowadzą już wojnę totalną"

Jak odbywa się przeszukiwanie internetu pod kątem skradzionych artykułów?

Każdy wydawca wybiera, jakich konkretnie artykułów lub ich fragmentów mamy szukać. Przekazuje nam ich treść, którą wprowadzamy do oprogramowania. Potem skanujemy strony internetowe pod kątem fragmentów tych tekstów. W dużym skrócie można powiedzieć, że robimy to za pomocą specjalnie napisanego programu, tzw. robaka, który skanuje strony w sieci. By zwiększyć liczbę stron internetowych, które przeszukujemy, współpracujemy z wyszukiwarkami internetowymi, m.in. Google czy Netsprint.

Gdy wydawcy zaczęli głośno mówić o problemie, powstał rynek dla firm śledzących takie kradzieże. Pojawiła się dla was konkurencja w postaci firmy Attributor, która podpisała umowę z Agorą. Ilu wydawców korzysta dziś z waszej usługi i ile to kosztuje?

Kosztuje tak naprawdę niedużo, ale wszystko zależy od konkretnego zlecenia. Obecnie mamy więcej niż 5 klientów. Oprócz dwóch wydawców dzienników pozostali to mniejsi wydawcy specjalistyczni, m.in. z branży farmaceutycznej. Wydawcy dopiero od niedawna zaczęli mocno interesować się problemem ochrony swoich treści w sieci, więc mamy nadzieję, że ich zainteresowanie naszą usługą będzie rosło. Uważam, że nasz mechanizm pomoże im obronić się przed kradzieżami treści, a tym samym – pozwoli przetrwać wartościowemu dziennikarstwu, którego nie są w stanie zapewnić ani portale, ani dziennikarze obywatelscy. By to osiągnąć, trzeba ukrócić działalność pasożytów, czyli serwisów, które korzystają za darmo z treści wydawców i zarabiają dzięki nim pieniądze, ale nie dzielą się nimi z tymi, którzy ponoszą największy ciężar ich stworzenia, utrzymując redakcje gazet. Wydawcy mają dziś dylemat, jeśli chodzi o udostępnianie swoich artykułów w sieci. Z jednej strony chcieliby rozwijać swoją ofertę on-line, ale z drugiej wiedzą, że prawo chroni ich w sposób niewystarczający i każdy udostępniony tekst może zostać szybko ukradziony. To pasożytowanie na ofierze, która ostatecznie może upaść, bo tego nie przeżyje, jeśli jego źródło przychodów będzie stale topnieć.

>>> Czytaj też: "Nie będziemy dojną krową dla biznesu internetowego"

Od kilku lat szukacie plagiatów prac dyplomowych na zlecenie polskich uczelni. Udało się wyeliminować to zjawisko?

Całkowicie wyeliminować nie da się nigdy, ale udało się – jak przyznają rektorzy uczelni – to zjawisko ograniczyć; sprawić, że jednak większa liczba studentów podchodzi do tematu poważnie i pisze swoje prace samodzielnie. Myślę, że w przypadku kradzieży treści wydawców w internecie może być podobnie. Im więcej będzie takich przypadków jak ostatnie wygrane procesy Infor Biznes, im więcej będzie się o tym mówić, tym łatwiej będzie ograniczyć to zjawisko. Tym śladem pójdą bowiem kolejni wydawcy, a to będzie miało swój pozytywny efekt edukacyjny. Na pewno pomocna będzie też technologia. Pewnym ideałem byłaby możliwość śledzenia każdego tekstu w czasie rzeczywistym, czyli monitorowania na bieżąco, gdzie i w jakim zakresie jest publikowany. Ale już dziś nie jesteśmy od niego aż tak daleko. Można oznakować tekst w taki sposób, by system śledził jego drogę. Wydawca może raz na kilka dni czy raz na tydzień otrzymywać raport, w jakich miejscach pojawił się konkretny tekst i jaka jego część została wykorzystana. Na razie nikt z naszych klientów nie korzysta jednak z tej usługi, ale próbujemy ich do tego namówić.

*Sebastian Kawczyński

prezes firmy Plagiat.pl