Competent / Новости / Статистика HTML-синтаксиса: какие теги самые популярные



Right menu

Не авторизован

Новое на сайте

«Веселые» картинки или печальный взгляд из трюма

Никто не хочет думать о том,
куда Титаник плывет?
Никто не хочет думать о том,
пока... Титаник плывет.

Матрос за штурвалом - Вы можете орать корпоративные лозунги хоть до ночи, но если мы не сменим курс, то въе***ся в айсберг.
Капитан - Приказываю главному по прокладке курса - доложить обстановку, разработать план мероприятий по оптимизации процесса коррекции курса, согласовать со всеми заинтересованными и незаинтересованными, провести селектор по теме... ...
Матрос за штурвалом - Нет, мы все-таки въе***ся...
Капитан - Главное без паники, командный дух превыше всего, мы должны быть единой командой, мы все как один и один как все...
Матрос за штурвалом - Пойду-ка я лучше плот надувать.

В Кемеровской области стали выпускать яйца "МТС". МТС думает, как реагировать.

Марка Традиционной Свежести" ("МТС"), сообщается на официальном сайте фабрики. Яйца в упаковках с очень знакомым рисунком поступили в продажу в Новосибирске, Кемерове, Томске и других сибирских городах. На упаковку яиц нанесена символика, практически идентичная фирменному стилю оператора мобильной связи компании МТС.

Сотовая связь: Госдума готовит жестокий закон

В скором времени тарифы крупнейших сотовых операторов и интернет-провайдеров начнут регулироваться государством, а сами компании могут быть приравнены к монополистам рынка. Соответствующие поправки к закону « О связи» в ближайшие недели поступят в Госдуму.

Реклама

Статистика

Rambler's Top100
Technorati Profile

Cache-Control: max-age=3600, must-revalidate Date: Пт, 06 Фев 2009 22:19:25 GMT Expires: Пт, 06 Фев 2009 23:19:25 GMT Last-Modified: Пн, 30 Янв 2006 12:01:31 GMT

Статистика HTML-синтаксиса: какие теги самые популярные

30 января 2006 г.

Компания Google провела масштабное исследование различных аспектов HTML-синтаксиса на выборке из более чем 1 млрд веб-страниц.
Собиралась и анализировалась информация о самых популярных названиях классов, элементах, атрибутах и метаданных. Хотя сам по себе HTML является четко формализованным языком, но использовать его можно по-разному. Подобные исследования показывают, каким образом авторы используют HTML, как предпочитают оформлять текст, какие самые распространенные ошибки и т.д.

Согласно статистике Google Web Authoring Stats, средняя веб-страница в Сети содержит 19 элементов разного типа. Около 98% всех веб-страниц содержат элементы «head», «html», «title» и «body». Нужно заметить, что три из них являются обязательными элементами HTML-документа. В то же время элемент «title» таковым не является, но все равно встречается в подавляющем большинстве веб-страниц.

После этих четырех самым популярным элементом является "a". Почти во всех случаях вместе с этим элементом используется атрибут «href», а в более чем половине страниц — атрибут «target».

Вот список других элементов в порядке убывания их популярности: «img» (кстати, на 24% изображений отсутствует тег «alt»), «meta», «br». На десятом и последующих местах расположились «table», «td» и «tr». После «href» и «target» самым популярным атрибутом является «border» для изображений и таблиц, затем «height» and «width» для изображений и различные параметры разметки таблиц. Для элемента «html» самыми популярными атрибутами являются «xmlns», «lang», «xml:lang» и «dir».

Анализ веб-страниц показывает, что очень часто в синтаксисе HTML встречаются ошибки. Это и бессмысленные, и странные атрибуты. Например, многие авторы включают в код страницы совершенно бессмысленный атрибут «revisit-after» для «meta name», вероятно, чтобы дать указание роботу поисковой системы. Но ни одна крупная поисковая система не поддерживает эту команду.

В итоговом документе много интересных фактов. Например, оказывается, тег «br» популярнее, чем тег "p". Еще один интересный факт: в интернете огромное количество страниц, в которых упоминается элемент «table», но отсутствует элемент «td». То есть имеется таблица, но отсутствуют ячейки.

Интересна статистика по редакторам, загрязняющим HTML-код своими нестандартными тегами. Повсеместно в интернете встречаются следы GoLive — это огромное количество тегов «table gridx=», «gridy=», «csscriptdict», «csactiondict», и «csobj». Конечно, GoLive не одинок. Например, в Сети чаще встречается нестандартный тег «o:p» из Microsoft Office, чем стандартный «h6». Кроме того, много элементов «x-claris-window», «x-claris-tagview» и «x-sas-window» (следы Claris Homepage), а также «отпечатков» ставшего популярным в последнее время пакета для создания интернет-магазинов британской компании Actinic — это «actinic:basehref», «actinic:section», «actinic:nowserving» и «actinic:curraccount». Здесь же и Macromedia со своими «mm:endlock» и «mm:beginlock», а также NetObjects Fusion, источник «nof=».

Сбор данных проходил в декабре 2005 г. Для просмотра аналитического отчета требуется браузер с поддержкой SVG и CSS, чтобы корректно отображать графики. Лучше всего использовать Firefox 1.5.