Парсер не определяет ТИЦ

 
 
 
Сообщения:14
Здравствуйте, помогите с парсером Яндекс ТИЦ для сайта на JSOUP.
Cделал вот такой код:

		String urlhttp = url.replaceAll("http://", "");
		String urlhttps = urlhttp.replaceAll("https://", "");
		doc4 = Jsoup.connect("https://yaca.yandex.ru/yca/cy/ch/" + urlhttps).userAgent(randomuser).timeout(10000).get();
		Elements yandextic = doc4.select("div[class=cy__not-described-cy]");
		String yandextic1 = yandextic.text().replaceAll("Индекс цитирования (", "");
		String yandextic2 = yandextic1.replaceAll(") ресурса — ", "");
		System.out.println("Яндекс ТИЦ: " + yandextic2);

Выходит ошибка:

Exception in thread "main" java.util.regex.PatternSyntaxException: Unclosed group near index 20
Индекс цитирования (
                    ^
	at java.util.regex.Pattern.error(Unknown Source)
	at java.util.regex.Pattern.accept(Unknown Source)
	at java.util.regex.Pattern.group0(Unknown Source)
	at java.util.regex.Pattern.sequence(Unknown Source)
	at java.util.regex.Pattern.expr(Unknown Source)
	at java.util.regex.Pattern.compile(Unknown Source)
	at java.util.regex.Pattern.<init>(Unknown Source)
	at java.util.regex.Pattern.compile(Unknown Source)
	at java.lang.String.replaceAll(Unknown Source)
	at WebsiteParser.main(WebsiteParser.java:108)


Как исправить, подскажите.
Изменен:27 дек 2016 00:35
 
 
Сообщения:158
В регулярном выражении круглые скобки являются специальными символами. В вашем случае их надо экранировать.
 
 
Сообщения:14
vps:
В регулярном выражении круглые скобки являются специальными символами. В вашем случае их надо экранировать.

Спасибо.
А не подскажите как исправить то что после нескольких запросов перестает показывать какие либо значения, допустим при частом запросе в Яндексе "site:sait.ru" ничего не находит. Может Яндекс отправляет капчу, но я этого не вижу, так вот скажите какие библиотеки помогут в отображении капчи (скриншот капчи) и отправке решенной мной капчи Яндексу.
 
Модераторы:Нет
Сейчас эту тему просматривают:Нет