Глоссариум по цифровой экономике. 1500 терминов и определений. Александр Юрьевич ЧесаловЧитать онлайн книгу.
(Data) Для социальных наук данные обычно представляют собой числовые файлы, полученные из методологий социальных исследований или административных записей, из которых производится статистика99.
Данные ограниченного использования (Restricted-use data) – это данные, которые содержат конфиденциальную информацию (обычно о людях), которая может позволить идентифицировать людей. Наличие конфиденциальной информации в депонированном цифровом контенте представляет собой проблему управления для долгосрочного хранения, чтобы гарантировать, что требования к архивному хранилищу для достижения распределенной избыточности учитывают, например, требования конфиденциальности100.
Данные тестирования (Testing Data) – подмножество доступных данных, выбранных специалистом по данным для этапа тестирования разработки модели.
Двоичное число (Binary number) – это число, записанное в двоичной системе счисления, в которой используются только нули и единицы. Пример: Десятичное число 7 в двоичной системе счисления: 111101.
Двоичный формат (Binary format) – это любой формат файла, в котором информация закодирована в каком-либо формате, отличном от стандартной схемы кодирования символов. Файл, записанный в двоичном формате, содержит информацию, которая не отображается в виде символов. Программное обеспечение, способное понимать конкретный метод кодирования информации в двоичном формате, должно использоваться для интерпретации информации в файле в двоичном формате. Двоичные форматы часто используются для хранения большего количества информации в меньшем объеме, чем это возможно в файле символьного формата. Их также можно быстрее искать и анализировать с помощью соответствующего программного обеспечения. Файл, записанный в двоичном формате, может хранить число «7» как двоичное число (а не как символ) всего в 3 битах (т. е. 111), но чаще используется 4 бита (т. е. 0111). Однако двоичные форматы обычно не переносимы. Файлы программного обеспечения записываются в двоичном формате. Примеры файлов с числовыми данными, распространяемых в двоичном формате, включают двоичные версии IBM файлов Центра исследований цен на ценные бумаги и Национального банка торговых данных Министерства торговли США на компакт-диске. Международный валютный фонд распространяет международную финансовую статистику в смешанном формате и двоичном (упаковано-десятичном) формате. SAS и SPSS хранят свои системные файлы в двоичном формате102.
Дезинтермедиация (Disintermediation) – это устранение посредников между производителями и потребителями103.
Действительный (xml) (Valid) – это XML-документ, правильность которого проверена на соответствие DTD или схеме. Процесс проверки подлинности документа называется валидацией. Обратите внимание, что это более строго, чем просто проверка правильности оформления документа104.
Декомпрессия (Decompression) – это функция, которая используется для восстановления данных в несжатую форму после сжатия
99
Data [Электронный ресурс] www.umich.edu (дата обращения: 07.07.2022) URL: https://www.icpsr.umich.edu/web/ICPSR/cms/2042#D
100
Restricted-use data [Электронный ресурс] www.umich.edu (дата обращения: 07.07.2022) URL: https://www.icpsr.umich.edu/web/ICPSR/cms/2042#R
101
Binary number [Электронный ресурс] www.umich.edu (дата обращения: 07.07.2022) URL: https://www.icpsr.umich.edu/web/ICPSR/cms/2042#B
102
Binary format [Электронный ресурс] www.umich.edu (дата обращения: 07.07.2022) URL: https://www.icpsr.umich.edu/web/ICPSR/cms/2042#B
103
Disintermediation [Электронный ресурс] www.igi-global.com (дата обращения: 07.07.2022) URL: https://www.igi-global.com/dictionary/user-generated-content-and-its-influence-on-tourists-choices/7933
104
Valid (xml) [Электронный ресурс] www.umich.edu (дата обращения: 07.07.2022) URL: https://www.icpsr.umich.edu/web/ICPSR/cms/2042#V